中国大模型数量占全球超1/3；AI模型训练成本暴涨，2027年或达1000亿美元；Kimi发布官方浏览器插件丨AI情报局

雷锋网 2024年07月09日 10:48

导语：产品推荐：MindPal，GaiaNet，AI Manga Translator，PocketPod

融资快报

Quantum Rise 获 1500 万美元种子资金：Quantum Rise 以所谓的“咨询 2.0”模式将 AI 部署到公司中，以自动化工作流程、提供路线图和量身定制的 AI 解决方案，并普遍加速业务发展。本轮由Growth Partners 投资。

Sanctuary AI 完成未公开融资：Sanctuary AI 正在构建具有类人智能的通用机器人。他们的类人机器人 Phoenix 专注于上半身任务，表现出类似人类的运动范围。这些机器人利用 Sanctuary 的 AI 控制系统 Carbon，增强了在 24 小时内学习和自动执行新任务的能力。领投方：BDC Capital 旗下 Thrive Venture Fund、InBC Investment Corp.

九科信息完成数千万元B1轮融资：九科信息孵化于招商局内部的创新“RPA+AI”项目，相关产品可以无缝集成到RPA机器人中，实现RPA任务自由调度，为国央企提供AI智能自动化平台。由诺辉基金领投，老股东深创投索斯福跟投。

智有范获A轮融资数千万元：智有范是一家一站式全屋智能系统研发服务商，专注Al+ loT领域，以前沿科技、打造高调性的全屋智能产品及服务应用于智慧家庭，及智慧小区、智慧办公、智慧养老等空间系统。此轮融资由主板上市公司产业孵化基金领投。

（欢迎添加微信AIyanxishe2，了解更多AIGC、融资情况，与志同道合的朋友一同畅聊时新AI产品）

国内情报：

月之暗面推出 Kimi 智能助手官方浏览器插件：

并为网页用户带来多项新功能。Kimi 插件，目前只有两个按钮：一个是点问笔，划选文字后就会出现；另一个是总结器，出现在网页右下角，快速总结全文、答疑解惑。

月之暗面杨植麟成阿里云新代言人，二者“联姻”，帮Kimi技术突破：

阿里云官宣两位新“代言人”——月之暗面科技有限公司创始人杨植麟和智联招聘集团总裁张月佳，这是月之暗面首次公开与阿里云的合作情况。信息显示，阿里云的算力和大模型服务平台助力月之暗面提升模型推理效率，加速Kimi智能助手实现技术突破。智联招聘集团的大模型应用也基于阿里云实现快速部署和上线支持。

此前 4 月份，阿里云也曾宣布过一波重量级「代言人」，包括百川智能创始人王小川、分众传媒创始人江南春、高途集团创始人陈向东等。

书⽣·浦语2.5 InternLM2.5-7B模型宣布开源，支持处理百万字长文：

InternLM2.5-7B 模型已开源，上海人工智能实验室承诺提供免费商用授权。该模型在数学评测集 MATH 上准确率达到 60%，与 GPT-4Turbo1106 版本相当，支持高达 1M tokens 的上下文，优化了长文档理解与智能体交互，具备搜索和整合上百个网页信息的能力，通过MindSearch多智能体框架，模拟人的思维过程。

快手推出AIGC微短剧《山海奇镜之劈波斩浪》由可灵提供技术支持：

该剧以《山海经》为灵感来源，通过赛博风格复现了上古神话世界中的神怪异兽和奇花异草。微短剧的制作得到了快手视频生成大模型“可灵”的深度技术支持，从山脉到海洋、从森林到天际的场景都呈现出升级后的视觉效果。

北大千问团队推出数学专用版CriticGPT，“找茬”让大模型进步更快:

北大千问团队推出了专门用于数学问题的 CriticGPT 变体 Math-Minos。该模型通过引入故意设置的错误并详细标注，训练出能够进行 debug 的模型，从而提升了模型在数学问题解决方案的验证能力。研究团队采用了 GPT-4 生成的逐步自然语言反馈作为理由标签，不仅指出了解决方案的正误，还能分析出错误的原因。

中国AI大模型数量占全球超1/3：

根据中国信息通信研究院发布的《全球数字经济白皮书》，中国在全球人工智能大模型的占比已超过1/3，达到36%，仅次于美国的44%。在全球AI企业数量上，中国以15%的占比紧随美国之后，位列第二。同时，中国的AI独角兽企业数量也达到了71家。

中国AI大模型论文数量全球第一，清华力压麻省理工、斯坦福：

根据美国乔治城大学的数据分析平台 ETO 最新调查报告，2017—2022 年期间，全球发布了 125.5 万篇与 AI 相关的论文，其中中国发布了 24.3 万篇，占到了总数的 25%，排名第一。美国位列第二，发布了 17.1 万篇论文。ETO 只统计了英文技术论文，如果算上中文论文，中国发布的论文数量将会更多。中国AI论文的被引用次数领先美国，中国科学院排名第一、谷歌排名第二，清华大学排名第三超过了麻省理工、斯坦福、卡内基梅隆等著名大学。

周鸿祎称2024年是大模型场景之年，To C将出现杀手级应用：

“大模型是风口，不是泡沫。”周鸿祎表示“今年英伟达市值一直狂飙，超越了微软和苹果，这就是人类进入人工智能时代的一个标志。”周鸿祎称，今年年初的时候，我说24年会是大模型的场景之年，当时很多同行不以为然，在刷各种参数，但是到了6月份，我觉得整个研究就都转过来了。“因为模型不是产品，模型只是能力，你有了人工智能的能力，还要结合具体的需求。”

国际情报：

X 被曝将新增多项 Grok 模型功能支持，含聊天机器人侧面板：

独立应用程序研究者 Nima Owji 表示，X 社交平台正在开发多项基于 xAI Grok 模型的功能，为 X Premium 订阅用户提供更丰富的使用体验。其中之一便是类似于其他生成式 AI 聊天机器人的 Grok 侧面板，用户可在使用 X 平台任意功能时同 Grok 机器人交流。X 还将新增两项功能：账户总结和高亮文本搜索。这几项功能尚未向公众开放，新功能旨在提升 X Premium 付费订阅的吸引力。

ChatGPT无法取代人类程序员！ IEEE 35页论文测出困难编码正确率仅为0.66%:

IEEE 在其期刊上发表了一项关于 ChatGPT 代码生成能力评估的论文，该研究使用 LeetCode 问题库作为数据集，揭示了 ChatGPT 生成功能性正确代码的能力差异很大，成功率从 0.66% 到 89% 不等，受到任务难度和编程语言等多种因素的影响。在对C、C++、Java、JavaScript 和 Python进行测试后，研究人员发现即使在某些情况下 AI 能够生成优质代码，但也存在安全性问题。

科幻照进现实？Open-TeleVision支持远程操控机器人：

加州大学圣地亚哥分校和麻省理工学院的研究员们开发了一款开源远程操作系统，名为 Open-Television。该系统支持多种设备，能够提供实时立体视频流，用户可以通过 VR 头显隔空操控机器人。其核心理念是模拟人类双目立体视觉和活动颈部，提升操作的自然性和沉浸感。该系统采用逆运动学算法将 VR 头显的 API 映射到机器人身上，实现精确的动作传递，基于 Web 平台，随时随地可以通过浏览器访问。此外，该系统还解决了人形机器人和人体自由度不匹配的问题，并通过遥操作方式采集的数据训练机器人自主完成任务。

项目地址：https://github.com/Improbable-AI/VisionProTeleop

哈佛DeepMind在世界模拟器驯养「赛博老鼠」：

哈佛大学与谷歌 DeepMind 人工智能实验室合作，开发出了一只搭载 AI 大脑的“虚拟老鼠”，能够模拟真实啮齿动物的所有动作，甚至表现出未经明确训练的新奇行为。这项研究结果发表在 Nature 期刊上，标志着虚拟神经科学领域的开创。虚拟老鼠的大脑由人工神经网络构成，通过在物理模拟器 MuJoCo 中的训练，能够准确预测真实老鼠大脑中的神经活动。这一技术不仅有助于理解大脑如何产生复杂动作，还可能用于设计改进的机器人控制系统。

单卡A100实现百万token推理，速度快10倍:

微软和萨里大学的研究团队提出了 MInference 方法，旨在通过动态稀疏注意力机制加速长上下文语言模型的预填充阶段。这种方法能够在不修改预训练模型和不进行额外微调的情况下，直接应用于现有的 LLM。通过实验验证，MInference 能够显著降低 A100 上的预填充推理延迟，提升速度至多 10 倍，并在多项任务中保持或提高准确性。

苹果大模型Siri预计明年1月启动测试：

古尔曼最新爆料，AI加持的Siri并不会立即随着iOS18的发布而到来，苹果计划于明年1月启动测试，并预计在iOS18.4版本中正式推出这一革新性功能，留给用户近九个月的期待时光。

Anthropic CEO称AI 模型训练成本暴涨，2027 年或达 1000 亿美元：

Anthropic 首席执行官表示，当前 AI 模型训练成本高达10亿美元，未来三年有可能上升到100亿美元甚至1000亿美元。在 AI 训练成本的上升趋势中，硬件和能源消耗是两大重要成本支出。英伟达等供应商的 GPU 交付量将呈几何级增长，而数据中心的电力需求也将急剧增加。此外，人力资源、数据采集和运行维护等方面也将耗费大量成本。如果不解决这些问题，AI 模型的训练成本有可能在2027年达到1000亿美元。

更多国际情报：

新加坡研究团队制作出可食用的 3D 打印二维码：这一技术采用了全新设计的挤出系统，能够在不同食物材料之间进行切换。

反AI图像盗窃工具Glaze需求量剧增：该工具可以在图像中添加难以察觉的噪点，以防止 AI 系统模仿风格的工具。据 Glaze 开发者 Ben Zhao 称，自 Meta 宣布利用用户数据进行 AI 训练计划后，WebGlaze 的网页版本的访问请求积压巨大。

Meta AI 将在 Android 版 WhatsApp 中增强图像处理能力：这个新的测试版本将允许用户直接向 Meta AI 发送照片，并就这些图片提出问题或使用文字提示来编辑图像。

日本总务省报告，该国仅 9.1% 的个人使用生成式 AI，远低于中美英等国：数据显示，日本个人使用生成式 AI与中国的 56.3%、美国的 46.3%、英国的 39.8% 和德国的 34.6% 存在较大差距。

Product Hunt 热榜，智能工作流程AI助手MindPal

MindPal作为一款AI工作流程构建工具，近期在Product Hunt平台上荣获当日最佳产品。这款工具提供了丰富的模板和自定义选项，涵盖从PESTLE分析到品牌标语生成等多个领域，旨在帮助企业高效自动化各种任务。用户可以根据自身需求快速构建AI工作流程，利用多种数据类型进行训练，并将AI代理与常用工具无缝连接。

MindPal的核心优势在于其灵活性和效率提升。它支持多个AI代理协作完成复杂任务，允许用户选择最佳AI模型，甚至可以在非工作时间自动运行工作流程。

?https://mindpal.space/?ref=producthunt

GitHub Trending 热榜，AI生态去中心化网络GaiaNet

GaiaNet作为一个创新的去中心化人工智能代理网络，正在重塑AI推理的未来。该平台允许个人将闲置硬件贡献为GaiaNodes，支持包括Huggingface、Llama、Gemma等在内的2000多种大型语言模型，实现分布式AI推理。GaiaNet的核心优势在于其无单点故障、多样化、审查抗性和强大的隐私保护特性。

通过GaiaNet Protocol和GaiaAPI，该平台为开发者和用户提供了一个开放、安全的AI生态系统。在教育和商业领域，GaiaNet展现出巨大潜力，如个性化AI助教和灵活的AI角色扮演。这一创新平台不仅为AI应用开辟了无限可能，还通过其独特的网络架构和强大的模型支持，正在推动AI技术向更加去中心化、民主化的方向发展。

?https://www.gaianet.ai/

开发者推荐

1.AI多功能助手Onyxium：集成创新技术提升工作效率

Onyxium作为一个综合性AI工具集成平台，为个人和企业用户提供了从图像识别到文本分析、语音识别等多项功能。该平台以技术优先、易用性和成本效益为核心，通过云服务实现全球覆盖，并根据用户行为提供个性化体验。Onyxium的工具设计简单易用，能够帮助用户进行对象和模式识别、情感分析、关键词提取等多种任务。

为满足不同规模用户的需求，Onyxium提供多种定价方案，包括面向初创企业的个人计划和针对大型企业的商业计划，同时还设有免费试用选项。用户反馈显示，Onyxium在提高生产力和创造力方面表现突出，被认为是一个有价值的效率工具。平台还通过新闻通讯为用户提供最新AI发展信息和独家资源，并设有FAQ部分以便快速解答常见问题。

?https://onyxium-ai-xi.vercel.app/?ref=producthunt

2.AI漫画翻译新选择：AI Manga Translator助力多语言阅读

AI Manga Translator作为一款专业的在线漫画翻译工具，正在为全球漫画爱好者带来全新的阅读体验。这个平台利用人工智能技术，包括DeepL和LLM的API，为用户提供快速、准确的多语种漫画翻译服务，同时保持原始图像的布局和结构。支持的语言范围广泛，从中文、英文到日语、韩语等多种语言，满足不同用户的需求。

?https://aimangatranslator.com/manga-translator/

3.AI驱动个性化播客：PocketPod

PocketPod作为一款由Y Combinator和ElevenLabs投资的AI播客产品，正在为用户带来全新的音频内容体验。这款创新产品允许用户选择感兴趣的主题，随后通过AI技术自动从互联网搜索、聚合、清洗信息并生成个性化播客。PocketPod支持多种应用场景，包括每日新闻和特定主题深入研究，例如关于苹果技术的专题播客。其核心优势在于全面的自动化处理，能够实时将最新信息转化为可听内容，为用户提供即时、个性化的音频资讯服务。

?https://pocketpod.app/

4.Suno AI Prompt Generator：AI辅助音乐创作工具

Suno AI Prompt Generator是一款免费的在线工具，专为音乐创作者设计。该工具允许用户通过自定义元标签和多种音乐风格来生成歌曲和歌词，提供创意的AI提示以激发灵感。用户可以探索包括摇滚、流行等在内的多种音乐类型。

?https://sunoprompt.com/zh?ref=therundown

前沿技术

1.AI视频创新：MOTIA让视频拓展无限可能

MOTIA (Mastering Video Outpainting Through Input-Specific Adaptation) 作为一种新型的视频外绘制技术，正在revolutionizing视频内容创作领域。这项由扩散模型驱动的技术能够智能地在原始视频视角之外生成高质量、连贯的内容，为创作者提供了前所未有的创意空间。

MOTIA的核心优势在于其两阶段处理方法：首先通过输入特定适应学习源视频模式，然后利用模式感知外绘制技术扩展视频边界。这种创新方法不仅提高了生成质量，还增强了灵活性，无需大量特定任务调整就能在多个基准测试中超越现有最先进的方法。MOTIA为视频创作者、电影制作和虚拟现实等领域开启了新的可能性，标志着视频处理技术的重大突破。

?https://be-your-outpainter.github.io

2.BeyondScene: AI突破视觉极限，超高清人物场景生成

BeyondScene作为一项突破性的AI视觉技术，正在为高分辨率人物场景生成开辟新天地。这个创新框架克服了现有文本到图像扩散模型的局限，能够生成超过8K分辨率的精美人物场景，同时保持出色的文本-图像对应性和自然度。

该技术无需昂贵的重新训练，就能超越预训练扩散模型的能力，为高分辨率人物场景创作开启了新的可能性。BeyondScene在详细文本描述的对应性和自然度方面均优于现有方法，为电影制作、虚拟现实和数字艺术等领域带来了革命性的变革。

?https://github.com/BeyondScene/BeyondScene

3.MInference 1.0：长文本LLM推理的革命性加速器

微软公司和萨里大学的成员推出MInference 1.0作为一项突破性技术，正在为大型语言模型(LLM)的长文本处理带来显著提升。这个创新框架通过动态稀疏注意力机制，有效解决了LLM在处理长序列时面临的计算挑战，尤其是在预填充阶段的效率问题。核心创新点：

-识别并利用长文本注意力矩阵中的三种独特模式：A形、垂直条纹和块稀疏。

-离线确定每个注意力头的最佳模式，并在推理过程中动态构建稀疏索引。

-通过优化的GPU内核执行高效的稀疏注意力计算。

?https://hqjiang.com/minference.html

4.ax-llm/ax：智能代理构建的多功能Typescript库

ax-llm/ax是一个基于Stanford DSPy论文的创新Typescript库，为构建大型语言模型（LLMs）驱动的智能代理提供了强大支持。这个多功能工具包支持多种LLMs和矢量数据库，提供了一系列高级功能，如流式输出验证、多模态DSPy支持和自动提示调优。ax-llm/ax简化了LLMs的集成和应用，支持自动生成类型安全的提示，允许构建可调用其他代理的代理，并能处理各种格式的文档。该库还集成了OpenTelemetry追踪和观测功能，以及自动调优提示效率的优化器。开发者可通过npm安装使用，通过运行示例快速上手，为AI应用开发提供了一个全面而灵活的解决方案。

?https://axllm.dev/

热议话题

AI数据中心遭"炸弹"威胁？艺术与科技的对决引发热议

近日，一则关于"Art tools "的推文意外获得11.7万点赞，引发网络热议。一幅讽刺漫画将传统艺术工具与AI数据中心并列，，将AI数据中心比作一个潜在的"破坏性"工具。暗示AI可能对传统创作方式产生冲击，进一步加剧了讨论。

这场争议反映了公众对AI技术的复杂态度。有人担忧AI威胁就业和社会秩序，也有人认为无需过度忧虑。讨论涉及AI对艺术创作的影响、财富分配问题，以及如何在科技发展与传统保护间寻求平衡。这一事件凸显了在AI快速发展的今天，社会各界需要共同探讨AI与人类和谐共存的方式。这场争议反映了公众对AI技术的复杂态度。有人担忧AI威胁就业和社会秩序，也有人认为无需过度忧虑。讨论涉及AI对艺术创作的影响、财富分配问题，以及如何在科技发展与传统保护间寻求平衡。这一事件凸显了在AI快速发展的今天，社会各界需要共同探讨AI与人类和谐共存的方式。

敬请期待明日的最新动态！

AI情报局征集情报合伙人，汇集独家价值线索！如果您可以提供有关AI最新成果&行业内幕&独特产品，请添加运营微信号：AIyanxishe2备注行业岗位。

雷峰网(公众号：雷峰网)

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

0人收藏

查看原文