字节、阿里、百度开打大模型价格战，应用端即将崛起！

多知网 2024年05月21日 18:10:50

多知5月21日消息，继上周字节跳动的大模型喊出比行业便宜99.3%之后，今天阿里云也宣布大模型降价了，紧跟着，百度智能云宣布文心大模型两大主力模型全面免费，立即生效。

5月15日上午，字节跳动旗下云服务平台火山引擎总裁谭待在发布会上正式宣布，字节跳动自研豆包大模型对外提供服务。

谭待称，经过一年时间的迭代和市场验证，豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一，目前日均处理1200亿Tokens文本，生成3000万张图片。

根据在发布会披露数据，豆包用户规模在快速增长，月活用户数已达2600万，被创建智能体达800多万个。

在定价方面，字节是第一家降价的大厂，谭待在发布会上宣布，豆包通用模型pro-32k版模型推理输入价格仅为0.0008元/千Tokens，比行业低99.3%。

一元钱就能买到豆包主力模型的125万Tokens，大约是200万个汉字，豆包称，200万个汉字相当于3本《三国演义》。

紧跟着，5月21日，阿里云宣布，通义千问GPT-4级主力模型Qwen-Long，API(应用程序编程接口)输入价格从0.02元/千tokens降至0.0005元/千tokens，降价幅度高达97%。

这意味着，1元钱可以买200万tokens。阿里云称，200万个汉字相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入。

而百度智能云直接在官方账号宣布，文心大模型两大主力模型ENIRESpeed、ENIRELite将全面免费全面免费，上下文长度为8K、128K。

值得注意的是，百度文心大模型系列包括：旗舰版的ERNIE3.5和4.0，和轻量版的ERNIE Speed、Lite、Tiny等。也就是说，百度宣布免费的是小尺寸的模型ENIRESpeed和ENIRELite。

具体来看，ERNIE Speed是百度在2024年发布的自研高性能大语言模型，通用能力优异，适合作为基座模型进行精调，更好地处理特定场景问题，同时具备极佳的推理性能;ERNIE Lite则是百度自研的轻量级大语言模型，兼顾优异的模型效果与推理性能，适合低算力 AI 加速卡推理使用。

但小尺寸的模型可能对于不少创业公司已经够用。百度创始人、董事长兼首席执行官李彦宏在Create 2024百度AI开发者大会上曾解释： “小模型推理成本低，响应速度快，在一些特定场景中，经过SFT(监督)精调后的小模型，它的使用效果可以媲美大模型。这就是我们发布ERNIE Speed、Lite、Tiny三个轻量模型的原因。”

不但是大厂降价了，最近，大模型初创公司智谱AI将旗下入门级大模型GLM-3-Turbo(128K上下文)的价格从0.005元/千tokens降低到0.001元/千tokens，降幅达80%。私募巨头幻方量化旗下的大模型DeepSeek-V2(32K上下文)价格降至每千tokens输入0.001元、输出0.002元。

对比国外，国外厂商GPT-4、Gemini1.5 Pro及Claude 3 Sonnet每千tokens输入价格分别为0.22元、0.025元及0.022元，均远高于国内的价格。

可以看到，大厂们让大模型价格“卷”起来了，预示着大模型的商业化更进一步，但也让一些直接研发大模型的创业公司面临更残酷的竞争，同时，也预示着应用端即将崛起。

有“教育+AI Agent”项目创始人向多知提到：“对于我们这些初创公司而言，在调用大模型的时候非常注重价格，价格低的产品对我们更有吸引力。尤其是AI Agent，需要调用不同的大模型。”

不过也有业内人士提到：“大模型的应用，不仅要看价格，还要看应用效果和响应速度。”

不论如何，对于教育应用场景来说，迎来更好的机会，未来将有更多大模型应用落地。（多知王上）

查看原文