远大期货官网

客服电话

原油资讯

大模子价钱战,还能再狠一点-外盘期货

来源:正大期货-正大国际期货-专业国际期货交易平台    作者:网络    

谁也未曾想到,大模子产业的首次“整体会战”,居然围绕价钱睁开。

5月6日,私募巨头幻方旗下的深度求索,打响了降价*枪。深度求索宣布的模子DeepSeek-V2(32k),在数学、编程、中英文等能力上已迫近GPT-4;然而,DeepSeek-V2的使用价钱仅约为GPT-4o的1/35。

DeepSeek-V2的输入与输出价钱划分为1元/百万tokens和2元/百万tokens,远低于市场价。

比拼多多砍一刀还廉价的价钱,惊动了不少美国专家。着名剖析师Dylan Patel读完DeepSeek-V2的论文后,激动地示意,“这可能是今年*的一篇。[1]”

DeepSeek-V2的论文

一周后,“卷王”字节跳动又添一把火。

豆包通用模子Pro-32k的输入价钱,被一刀砍到了更低的0.8元/百万tokens。火山引擎总裁谭待示意,“豆包比行业价钱低了99.3%,大模子往后以厘计价。”

眼看友商云云不讲武德,其他科技公司再也坐不住了。

阿里率先回手,一狠心,大肆下调了所有模子的价钱。

几个小时后,百度爽性冲向竞价终点:宣布两款轻量级模子周全免费。紧接着,科大讯飞星火Lite API、腾讯混元大模子lite 256k也相继宣布免费。

云云盛况,很难不让人梦回那段滴滴大战快的、ofo摩拜互扯头发的激情岁月。

然而,围绕大模子的价钱战,远不如网约车、共享单车那般直观,种种专业名词让人摸不着头脑。以是,这些大模子公司,到底在热闹些什么?

价钱战的B面

想要明白这点,首先得知晓大模子的商业模式。以阿里云为例,它所提供的大模子服务,共有3种[2]:

(1)基础服务:模子推理。

模子推理,指的是凭证输入的信息内容,给出回覆的历程。换句话说,推理就是“现实使用”模子的历程。

阿里云预置了多个性能差其余“尺度版模子”,供用户推理。该服务的计费方式很简朴,即“以量计价”:以消耗的token数目为单元,用得越多,用度越高。而且性能越好的模子,收费越贵。

token是大模子用来权衡文本长度的一种计数单元,可以简朴明白为“字数”。3本篇幅为75万字的《三国演义》,约莫需要125万个token。

(2)进阶服务:模子微调。

若是以为“尺度版模子”欠好用,阿里云还提供了“定制研发”服务,即模子微调。详细收费,则取决于“定制研发”消耗的盘算资源与开发周期。

(3)超进阶服务:模子部署。

当用户需要耐久使用大模子时,*的方式是将它部署到独占实例中。

独占实例,指的是直接承包一个或多个物理服务器的所有资源。翻译成人话就是,不再只是租一个商铺,而是将整个商业广场都租下来。

这么做的利益在于,没有其余商户和你抢盘算资源,响应速率更快。

其收费模式,也是以量计价,但有两种形式:阿里是直接根据“商业广场”消耗的盘算资源计费;除此之外,百度还支持根据模子推理的token数目计费。

这3种收费模式,面向的是企业与小我私人开发者,代表了大模子开发由浅入深的历程。而各大科技公司疯狂砍价的,实在是上文提到的“基础服务”,即“尺度版模子”的推理用度。

推理用度的详细订价,又分成了“输入”和“输出”两部门。

简朴来说,输入就是用户提问的内容,而输出则是大模子的回覆。科技公司往往会凭证输入和输出的token数目(字数),举行两次计费。

这种庞大又细微的差异,很容易成为科技公司的套路。

例如字节跳动的“0.8元/百万tokens”“比行业价钱低99.3%”,实在只是输入价钱。豆包通用模子Pro-32k的输出价钱仍是2元/百万tokens,与DeepSeek-V2等偕行持平。

由此可见,别看大模子价钱战打得火热,背后实则尚有洞天。

降价的千层套路

可以发现,本轮价钱战最为活跃的,基本上都是云盘算公司,代表厂商是BAT和字节跳动。

它们之以是敢云云降价,照样由于能从其余地方填补损失,羊毛出在羊身上。

正如前文提到,降价甚至免费的,实在只是基础服务。

毫无疑问,这可以辅助中小开发者以更低的成本构建应用。然而,当开发者或者企业,需要更贴合自身营业,深入使用大模子时,往往绕不开进阶的模子微协调模子部署——这两项服务,可不是本次价钱战的主角。

例如百度宣布免费的ERNIE-Speed-8K,若是现实部署,收费就酿成了5元/百万tokens[3]。

在中国,保时捷怎么不香了?

与此同时,各家降价最狠的,实在都是轻量级的预置模子;相比之下,性能更强悍的“超大杯”模子,现实降价幅度没有那么夸张。

例如阿里的Qwen-Max,现实与字节跳动的豆包通用模子Pro-32k一样,只是降低了输入的价钱;而隔邻的百度,压根没提超大杯模子。

云盘算厂商的价钱战,更像是用“免费游戏”的形式吸引更多玩家加入;但若想继续“升级变强”,该氪金还得氪金。

固然,云盘算厂商并非*的介入者。

以深度求索与智谱AI为代表的明星初创公司,之以是也敢跟进内卷,很洪水平上是由于有足够的弹药,尤其是算力资源。

早在大模子尚未发作的2020年,背靠私募巨头幻方的深度求索,就投资了上亿元筹建AI超级盘算机。

现在,幻方是除BAT、商汤、字节跳动外,第六家拥有1万张以上英伟达A100 GPU贮备的中国公司[4]。

而智谱AI则背靠阿里和腾讯,是估值过百亿的AI独角兽公司。

2020年时,智谱AI也恰巧囤积了不少GPU资源。其CEO张鹏曾在接受《中国企业家》采访时提到:

那时,他熟悉的一家云盘算厂商,有一批GPU积灰了。这批GPU原本是供应给游戏公司的,但阴差阳错之下,对方又不买了。张鹏知道这个新闻后,顺势接盘了这批盘算资源[5]。

现金流、算力资源都足够的情形下,即便烧钱换市场,这些初创公司也能扛得住。

那么问题来了:昔时移动互联网津贴换市场,尚可以简朴粗暴地归由于“手艺门槛低”;主打一手高科技的大模子,怎么也没走出价钱战的怪圈?

必经之路

大模子智能化带给众人的震撼,往往让人忽视它的本质,实在是一种基础设施。

去年,着名盘算机科学家吴恩达曾在公然演讲中提到:

AI实在是一系列工具的聚集。这些工具包罗了监视学习、非监视学习、强化学习,以及现在的天生式人工智能。所有这些都是通用手艺,意味着它与电力和互联网等其他通用手艺,并没有什么区别[6]。

电力与互联网,并没法直接缔造价值;真正改变天下的,实在电灯、电脑、电商、电子游戏。

然而,应用的发作实在有一个条件:即基础设施足够廉价。此前,大模子应用没能快速铺开的一个主要逆境,正是使用成本过高。

哄哄模拟器就是一个典型的案例。

今年年头,一位名叫王录取的自力开发者,开发了一款模拟“生气女同伙”形象的AI应用。该应用的玩法很简朴,用户必须斗智斗勇哄好对话窗口里的AI女友。

由于交互简朴和立意颇有情趣,哄哄模拟器上线*天就吸引了60多万用户。

突然的爆红,却让王录取啼笑皆非。哄哄模拟器使用了预置的GPT-3.5模子,运营一早上就花了他2000多美金的推理用度。

这就相当于,开发了个App,还没想到咋赚钱,先交了1万块钱电费。

纵观历史可以发现,昔时移动互联网的大规模普及,也是确立在基础设施降本之上的。

2014年的一份观察讲述显示,那时由于流量用度高昂,手机用户天天使用流量不会跨越3小时。且不使用移动网络时,许多用户会选择将其关闭,以防止手机应用在后台消耗流量[7]。

彼时,大多数用户,都曾做过“一醒悟来屋子归中国移动”的噩梦。

2013年的时刻,快手就明确了“短视频社区”的定位,但增进相对缓慢。这背后,很难说没有大环境的缘故原由。

事实上,直到电信运营商最先大搞“降费提速”,短视频行业才真正最先发作。

2019年,手机上网流量资费较2014年时已下降了超90%[8]。至此,手机淘宝、微信、抖音等才逐渐成为字面意义上的“国民应用”。

由此可见,降价实在是大模子产业生长的必经之路。

也许在这轮价钱战中,云盘算厂商与初创公司,各有各的小九九;但对开发者和通俗用户来说,建议可以打得再狠一点。

参考资料

[1]OpenAI Is Doomed,SemiAnalysis

[2]阿里云大模子服务平台百炼

[3]千帆大模子平台

[4]量化巨头宣布*代大模子:免费商用,完全开源,汹涌新闻

[5]智谱AI CEO张鹏:中国大模子创业者,不再追随OpenAI,中国企业家

[6]Andrew Ng: Opportunities in AI - 2023,Stanford Online

[7]2014年中国手机流量使用讲述:近四成用户流量不够用,中国新闻网

[8]工业和信息化部组织召开“提速降费”用户面临面座谈会