量子位

提示:原网页已由神马搜索转码, 内容由m.163.com提供.

量子位

网易号

关注

17.5万粉丝

0关注

8.0万被推荐

IP属地：北京

《量子位》官方网易号

3枚勋章

2次获得编辑精选

追踪人工智能动态

全部
文章
视频

量子位

《量子位》官方网易号

#清华系细胞大模型登Nature子刊# 生命科学领域的基础大模型来了！来自清华、百图生科的团队提出的单细胞基础大模型scFoundation，登上Nature Methods。该模型基于5000万人类单细胞测序的数据进行训练，拥有1亿参数，能够同时处理约20000个基因。团队在模型架构上进行了创新，相同参数量下计算时间是传统Transformer架构的3%左右。相关研究成果也被NeurIPS2024接收。清华大学自动化系博士研究生郝敏升为该论文的第一作者。清华大学张学工教授，马剑竹教授，百图生科宋乐教授为通讯作者。作为基础模型，它在细胞测序深度增强、细胞药物响应预测和细胞扰动预测等下游任务中表现出卓越的性能提升，并为基因网络推断和转录因子识别提供了新的研究思路。清华系细胞大模型登Nature子刊！能对人类2万基因同时建模，代码已开源

NET/NBOT2/IMG/5CB5F5B29B71381533F1011E6E5D98F4长图

行业密探
量子位

《量子位》官方网易号

#Transformer五年内重构# -未来5年内会在AI技术架构上有大的突破，Transformer会被逐步重构。-15-20年内实现通用人工智能（AGI），并通过“新图灵测试”。在“太湖对话：人工智能+”暨清华大学AIR无锡创新成立仪式上，张亚勤院士给出这样的趋势判断，并点名了包括多模态、具身智能、生物智能、Agent智能、边缘智能这五个重要发展方向值得关注。其中又以具身智能当中无人驾驶为代表。他更是放言：它将是未来五年最大具身智能应用。-2025年是无人驾驶的“ChatGPT时刻”，2030年无人驾驶成为主流，10%新车具备L4能力。本次涵盖主论坛以及三场圆桌论坛，包括张亚勤院士在内的诸多大牛，围绕智能产业、产业应用、自动驾驶等主题分享了不少观点值得参考。张亚勤：Transformer五年内会被逐步重构，15-20年内实现AGI | 清华AIR无锡创新中心成立

NET/NBOT2/IMG/126AECF5228545B0716645667FEE15AF长图

行业密探
清华系细胞大模型登Nature子刊！能对人类2万基因同时建模

2小时前
量子位

《量子位》官方网易号

#开源超闭源大模型# #通义千问Qwen2发布# 开源大模型全球格局，一夜再变。这不，全新开源大模型亮相，性能全面超越开源标杆Llama 3。王座易主了。不是“媲美”、不是“追上”，是全面超越。发布两小时，直接冲上HggingFace开源大模型榜单第一。这就是最新一代开源大模型Qwen2，来自通义千问，来自阿里巴巴。在十几项国际权威测评中，Qwen2-72B得分均胜过Llama3-70B，尤其在HumanEval、MATH等测试代码和数学能力的基准中表现突出。不仅如此，作为国产大模型，Qwen2-72B也“毕其功于一役”，超过了国内一众闭源大模型：Qwen2-72B相比于自家前代模型Qwen1.5-110B实现了整体性能的代际提升，而在上海AI Lab推出的OpenCompass大模型测评榜单上，Qwen1.5-110B已经超过了文心4、Moonshot-v1-8K等一众国内闭源模型。随着Qwen2-72B的问世，这一领先优势还在扩大。有网友便感慨说：这还只是刚开始。开源模型很可能在未来几个月，就能击败GPT-4o为代表的闭源模型。Qwen2的发布，可以说是一石激起千层浪。上线仅1天，下载量已经超过3万次。网友们还发现，除了72B和指令调优版本，这次同步开源的Qwen2-0.5B、Qwen2-1.5B、Qwen2-7B、Qwen2-57B-A14B，开源许可都换成了Apache 2.0——就是说可以更加自由地商用。这是Llama 3系列都没做到的。在AI大模型领域，时间和速度都不同了。因为距离阿里推出Qwen1.5-110B模型刷新SOTA，全球开源大模型形成双雄格局，才刚过去1个月时间。而现在，Qwen2独领风骚，全球开源第一，国产大模型第一——连不开源的大模型都超越了。

NET/NBOT2/IMG/4FC6CBFE2DE3F2D2FCCF0834C1D0170E长图

NET/NBOT2/IMG/43D842192F03B6AF15BE9FD53A869DA8长图

NET/NBOT2/IMG/9B104FA0C32085D534EDEE7322DFAD58长图

行业密探
张亚勤：Transformer五年内会被逐步重构，15-20年内实现AGI

3小时前
开源超闭源！通义千问Qwen2发布即爆火，网友：GPT-4o危

3小时前

1跟贴
12个国产大模型大战高考数学，意外炸出个大bug

3小时前

15跟贴
量子位

《量子位》官方网易号

头一回有企业家像摇滚巨星一样给粉丝签名，科技圈史无前例。网友：你能想像库克和劈柴哥也这么干吗#黄仁勋给粉丝签名引发争议#

行业密探
量子位

《量子位》官方网易号

我又又叒叕产生10W+爆款啦，大家快来围观吧~

PNG长图

行业密探
量子位

《量子位》官方网易号

#KAN# 一位苏联数学家，最近突然在AI圈火了。因为有个MIT中国留学生，用这位数学家67年前的发现，搞出了一种全新的AI技术——KAN。

行业密探
去世37年后，这位苏联数学家在AI圈火了

18小时前

1跟贴

10:36
产业级AI原生应用的「超级外挂」，应用已在200+行业场景落地

21小时前
量子位

《量子位》官方网易号

#视频生成模型又一新作# 美国数字媒体科技公司 Snap Inc. 和罗格斯大学的研究人员共同推出了 SF-V 。SF-V 是一个视频生成模型，最大特点是生成速度快。有多快呢？对于同一张图像，其他模型需要 36 秒，而SF-V 不到 4 秒。据了解，为了获得高保真视频，传统方法在采样时需要多次去噪，导致计算成本高昂且速度慢。而 SF-V 的团队利用对抗性训练对预训练的视频扩散模型进行微调，使其能够在单步前向（即输入到输出只经过一次计算）传播中合成高质量视频。其结果是——与传统的多步视频扩散模型相比，SF-V 模型大幅降低了计算开销，实现了约 23 倍的加速。项目介绍主页：论文：

行业密探
AI创业酱紫卷？想让陆奇看上眼，挑战个Sora/Transformer再说

1天前
一说AI会思考，祖师爷图灵就发笑：这个问题无意义，不值得讨论

1天前
量子位

《量子位》官方网易号

#一说AI会思考祖师爷图灵就发笑# ：这个问题无意义，不值得讨论大模型风靡全球，有人和AI助手搭伙工作，还有人AI智能体谈起赛博恋爱。最前沿的GPT-4o模型，甚至做到同时能听、能看、能说……一个人工智能学科诞生之初就争论不休的问题，又被抬到水面：机器究竟能思考吗？知名学者斯坦福李飞飞最近就此发声：不，大模型不具备知觉，参数再多也不行。图灵奖三巨头之一Geoffrey Hinton，和他的学生OpenAI前首席科学家Ilya Sutskever确都认为：随着时间的推移，AI系统可能会获得自我意识。更早一些时候，2022年夏天，被谷歌开除的工程师Lemoine警告公司认为“LaMDA模型已经有了知觉”，一时轰动科技界。此事件也被认为是让OpenAI感到竞争压力，提前把ChatGPT发布出来的原因之一。……其实这个问题，早在人工智能还只是概念的时候，就有很多大佬深入探讨过。比如“祖师爷”图灵本人，就曾与当时的学者展开一系列精彩辩论。相信无论是专业研究人员，还是对人工智能感兴趣的科技爱好者，都能从图灵的思想中获得启发与思考⬇️一说AI会思考，祖师爷图灵就发笑：“这个问题无意义，不值得讨论”

NET/NBOT2/IMG/AA3042C8B66BA8DEE204577689B27A1C长图

行业密探
量子位

《量子位》官方网易号

#国产抗体设计生成式AI大模型发布# AlphaFold3引起的浪潮下，一个新的抗体设计生成式AI大模型浮出水面。名为GeoFlow，能够同时用于抗原-抗体复合物结构预测和抗体从头设计。例如，给定抗原结构和特定表位，GeoFlow能够生成全新的抗体分子。在抗原-抗体复合物结构预测任务上，在由66个抗原-抗体复合物结构构成的测试集上，GeoFlow的Top-1成功率达43.9%，与AlphaFold3持平。GeoFlow研发团队来自生成式AI驱动的蛋白质设计研发平台公司——百奥几何，百奥几何由AI药物发现科学家唐建博士于2022年创立，AI三巨头之一、图灵奖获得者Yoshua Bengio担任首席科学顾问。与AlphaFold3持平！国产抗体设计生成式AI大模型发布，能同时预测抗原抗体复合物结构和抗体从头设计

NET/NBOT2/IMG/22811A16A5DAF0946A24791FFA3FDA43长图

行业密探
与AlphaFold3持平！国产抗体设计生成式AI大模型发布

1天前

1跟贴
量子位

《量子位》官方网易号

#OpenAI新公布研究中再见Ilya名字# OpenAI研究如何破解GPT-4思维，公开超级对齐团队工作，Ilya Sutskever也在作者名单之列。该研究提出了改进大规模训练稀疏自编码器的方法，并成功将GPT-4的内部表征解构为1600万个可理解的特征。由此，复杂语言模型的内部工作变得更加可理解。其实，早在6个月前，研究就已经开始进行了。OpenAI将其公开后，前超级对齐团队成员、论文一作前来转发分享：我们引入了一种基于TopK激活函数的新稀疏自编码器训练技术栈，消除了特征缩减问题，并允许直接设置L0。我们发现这种方法在均方误差/L0边界上表现良好。即使在1600万的规模下，也几乎没有失活的潜在单元（latent）。同样在坐着名单里的、此前在OpenAI超级对齐团队的Ilya同盟Jan Leike（就是从OpenAI愤而离职刚刚加入Anthropic的RLHF发明者之一）也表示：这是一项重大的进步！稀疏自编码器是目前用来真正理解模型内部思维的最好的方法。更有意思的是，不久前Anthropic发了一项类似的工作。成功从Claude 3.0 Sonnet的中间层提取了数百万个特征，为其计算过程中的内部状态提供了一个大致的概念性图。于是有网友就开麦了，工作牛是牛，但OpenAI是不是有点太着急了，论文链接没有指向Arxiv，分析似乎也没有那么深入。是不是为了回应Anthropic的研究以及Jan Leike出走的事儿，谁知道呢？（doge）回归正题，OpenAI超级对齐团队是如何想法子破解GPT-4思维的？

NET/NBOT2/IMG/AF9364AC339157B3407F8401F31F99E9长图 NET/NBOT2/IMG/89F10B965C6558D0389D9ABDD4E2D9BE长图

行业密探
量子位

《量子位》官方网易号

#百度智能云千帆平台AppBuilder# 今年AI领域的热门词汇，非”AI原生应用”莫属。而现在，这个浪潮之巅的方向，又一件神兵利器有了成绩单证明——百度智能云千帆AppBuilder。作为百度智能云推出的产业级AI原生应用开发平台，AppBuilder致力于打通大模型到业务的最后一公里。短短推出半年以后，AppBuilder公布了成绩单：服务客户数已突破10万，应用已在200+行业场景落地；原本可能需要一周的开发周期，一天就可以完成；一周时间就能完成20个应用功能更新。总结起来就一句话：确实易用、好用、用了起作用。但成绩之外，AppBuilder还在频繁迭代，以提供更专业的知识处理内核、更有效的AI周边组件、更灵活实用的开放方式。百度智能云千帆AppBuilder，不仅要领先，还要持续领先。

NET/NBOT2/IMG/547119CD4D0CA20F8107C0160D40920A长图

NET/NBOT2/IMG/F955F2E7619981E8F0AEC027A6E57C15长图

NET/NBOT2/IMG/2E80477B2565EA60805FE200D96ECAD5长图

NET/NBOT2/IMG/36ABFE32C25B6FA460E0E6E71A4BA4E0长图

NET/NBOT2/IMG/5FC5E496EEAB2D4097EC6AF415D07518长图

NET/NBOT2/IMG/B23A07C6DDA7C7F4B002A68A1EA77E3D长图

行业密探

正在载入...