國內(nèi)大模型公司,也沒有錯(cuò)過今年的 618。
" 降價(jià) 97%!"" 免費(fèi)!" 過去一個(gè)月,各大國產(chǎn)大模型廠商喊出了不要錢的架勢,降價(jià)之狠,讓外行驚嘆。
誰也沒想到,這場價(jià)格大戰(zhàn)是由一家本不在牌桌上的公司掀起的。
5 月 6 日,知名私募機(jī)構(gòu)幻方量化創(chuàng)立的大模型公司 " 深度求索 "(英文名:DeepSeek),發(fā)布了第二代 MoE 模型 DeepSeek-V2。模型迭代的同時(shí),其 API 調(diào)用價(jià)格直接降至每百萬 tokens 輸入 1 元、輸出 2 元。
僅為 GPT 4-Turbo 百分之一的定價(jià),讓這家公司在 AI 界迅速嶄露頭角,也讓一眾互聯(lián)網(wǎng)大廠和大模型獨(dú)角獸坐不住了。
不出半個(gè)月,智譜 AI、字節(jié)跳動、阿里云、百度、騰訊云、科大訊飛等頭部玩家紛紛加入降價(jià)行列,你追我趕地大舉下調(diào)了模型價(jià)格。
這番場景,讓人不禁回憶起 ofo 和摩拜的 " 單車之爭 "、滴滴與快的的 " 合并之戰(zhàn) "。短短兩年間,大模型這場不見硝煙的戰(zhàn)爭,似乎也步入了最簡單粗暴的階段。
然而,這場聲勢浩大的降價(jià)潮,究竟是單純的成本讓利,還是一場精心策劃的營銷之戰(zhàn)?為何一眾大廠迅速響應(yīng),大部分初創(chuàng)公司卻持觀望態(tài)度?大模型客戶們真的能從這波降價(jià)中獲益嗎?參與降價(jià)的企業(yè),真正的目的是什么?
真降價(jià)還是假噱頭?
截至發(fā)稿,公開宣布參與本次價(jià)格戰(zhàn)的公司共有 7 家,其中包括字節(jié)、騰訊、阿里、百度四家互聯(lián)網(wǎng)大廠,大模型創(chuàng)業(yè)公司 " 智譜 AI"、老牌 AI 上市公司 " 科大訊飛 ",以及這次價(jià)格戰(zhàn)的發(fā)起者 "DeepSeek"。
鏡相工作室研究發(fā)現(xiàn),這波來勢洶洶的價(jià)格大戰(zhàn),不像宣傳中那么簡單直降,而是一場精心計(jì)算的策略游戲。
首先,降價(jià)最狠的基本都是入門級的基礎(chǔ)模型,而那些最高配的模型其實(shí)并不打折。
每家大模型公司,都有一個(gè) " 模型家族 ",里面有性能不一的通用模型,也有擅長某些場景的專用模型。比如 OpenAI 旗下的 GPT-3.5 和 GPT-4,以及文生視頻模型 Sora。
以百度為例,百度宣布降價(jià)的兩款大模型,分別是適合在特定場景作為基座模型進(jìn)行精調(diào)的輕量級模型 ERNIE Speed,和參數(shù)更小、適合搭載在低算力卡上的 ERNIE Lite。而最新發(fā)布的超大規(guī)模模型 ERNIE 4.0 系列并未降價(jià)。
最先坐不住的智譜 AI,第一次宣布降價(jià)的也是其最基礎(chǔ)的模型 GLM-3 Turbo,最先進(jìn)的 GLM-4 并未搬上價(jià)格戰(zhàn)的牌桌。直到 6 月 5 日第二次降價(jià),才將 GLM-4 系列中的圖生文模型 GLM-4V 加入降價(jià)行列,但最常用的對話版模型依然沒有降價(jià)。
巧的是,部分公司降價(jià)的,也只是輸入部分的 tokens 使用量,輸出部分的價(jià)格不僅沒降價(jià),還在各家打出的降價(jià)廣告語中被悄悄隱藏了。
在 API 調(diào)用中,推理費(fèi)用的具體定價(jià),分成 " 輸入 " 和 " 輸出 " 兩部分。輸入指的是,用戶向大模型提出的問題,輸出則是大模型給出的答案。
例如騰訊的混元 -Pro 大模型,雖然輸入價(jià)格大幅下降了 70%,但輸出價(jià)格并未優(yōu)惠,依舊保持原價(jià)。同樣,阿里云的 Qwen-Max 模型輸入價(jià)格下調(diào)了 67%,輸出費(fèi)用也維持不變,沒有折扣。
在各家的宣傳里,有不少是拿自己降價(jià)的模型與別家最貴的模型作對比,才有了動輒 " 比行業(yè)水平便宜 90%" 的降價(jià)幅度,讓外界以為下了血本讓利客戶。實(shí)際上,模型之間性能不同、使用場景不同,有的降價(jià)是真有用,有的更多只是一個(gè)營銷噱頭。
其次,同一個(gè)模型不同的交付模式,也對應(yīng)著不同的價(jià)格。根據(jù)使用場景、部署方式和用戶需求,大模型的交付模式通常會分為基礎(chǔ)服務(wù)、進(jìn)階服務(wù)和高階服務(wù)。
基礎(chǔ)服務(wù)指的是,用戶直接調(diào)用平臺已經(jīng)預(yù)設(shè)好的 API,來使用模型的功能。而進(jìn)階服務(wù)意味著,用戶可以把模型部署到自己的服務(wù)器或云平臺上,然后根據(jù)使用場景對模型進(jìn)行微調(diào),可以理解為定制產(chǎn)品,在特定任務(wù)上的性能和準(zhǔn)確性會更高。
當(dāng)用戶覺得,大模型的響應(yīng)速度不夠快時(shí),可以選擇高階服務(wù),不再需要和其他人搶計(jì)算資源,用戶可以獨(dú)占所有計(jì)算資源,來確保調(diào)用頻率和響應(yīng)時(shí)長滿足業(yè)務(wù)訴求。
目前各家企業(yè)大幅降價(jià)的焦點(diǎn),更多集中在基礎(chǔ)服務(wù),即直接調(diào)用預(yù)置模型進(jìn)行推理。如果初級服務(wù)無法滿足需求,就需要更高級的模型微調(diào)和部署服務(wù),這部分其實(shí)并未降價(jià)。
以阿里云參與降價(jià)的通義千問主力大模型 Qwen-Long 為例,降價(jià)只針對基礎(chǔ)服務(wù)。對于尋求更高級服務(wù)的用戶來說,需要轉(zhuǎn)向其他模型產(chǎn)品,因?yàn)?Qwen-Long 模型本身不支持微調(diào)和自定義部署。
而百度宣布的兩款免費(fèi)模型,僅限于初級的平臺預(yù)置服務(wù)階段。一旦用戶需要模型部署或進(jìn)一步的精調(diào)服務(wù),免費(fèi)優(yōu)惠便不再適用。
以百度的 ERNIE Speed 模型為例,雖然基礎(chǔ)服務(wù)免費(fèi),但一旦用戶升級至進(jìn)階服務(wù),費(fèi)用即提高到 0.005 元 / 千 tokens。若用戶選擇更高級的服務(wù),價(jià)格則進(jìn)一步增至 0.008 元 / 千 tokens。隨著服務(wù)級別的提升,費(fèi)用也會相應(yīng)增加。
一分錢一分貨,想要得到更高級的服務(wù),用戶就需要花費(fèi)更多的錢。進(jìn)階服務(wù)和高階服務(wù),一般依照消耗的計(jì)算資源來計(jì)費(fèi),即實(shí)際訓(xùn)練過程中使用的計(jì)算資源和訓(xùn)練時(shí)長。
以智譜 AI 的 ChatGLM-130B 模型的私有化部署為例,企業(yè)用戶一年需要支付高達(dá) 3960 萬元的費(fèi)用。這一價(jià)格顯然只有具備一定規(guī)模和財(cái)力的大型企業(yè)客戶才能承擔(dān)。
因此,這一波降價(jià),只能說降低了企業(yè)用戶使用大模型的門檻,利好一些個(gè)人開發(fā)者和小創(chuàng)業(yè)公司,真要大規(guī)模使用大模型,依舊省不下太多錢。
為什么創(chuàng)業(yè)公司不參與價(jià)格戰(zhàn)?
與火藥味十足的大廠相比,資金有限的初創(chuàng)公司顯得更為冷靜。
除了智譜 AI 之外,包括百川智能、月之暗面、零一萬物在內(nèi)的幾家頭部大模型初創(chuàng)公司并未加入降價(jià)行列。MiniMax 雖然宣布了價(jià)格調(diào)整,但僅針對其語音模型進(jìn)行了調(diào)整,文本大模型的價(jià)格則保持不變。
創(chuàng)業(yè)公司是否跟風(fēng)降價(jià),主要得看幾個(gè)條件:一要看商業(yè)模式,有沒有必要跟;二要看技術(shù)能力,能不能跟得動;三要看生態(tài),能不能跟下去。
商業(yè)模式?jīng)Q定收入來源,大模型企業(yè)主要有兩種盈利途徑:一是面向企業(yè)客戶(B 端),銷售 API 服務(wù)或定制化大模型;二是直接面向消費(fèi)者(C 端),提供終端產(chǎn)品。
出售 API,是大模型公司常見的賺錢方式。企業(yè)訓(xùn)練出自己的模型后,通過 API 將其功能提供給開發(fā)者或企業(yè)。這樣,開發(fā)者無需從頭開始訓(xùn)練模型,只需輸入自己的數(shù)據(jù)進(jìn)行微調(diào),便能迅速開發(fā)出定制化的應(yīng)用程序。因此,降價(jià)主要受益的是開發(fā)者和企業(yè)客戶,對普通消費(fèi)者沒有直接影響。
以 C 端市場為主戰(zhàn)場的創(chuàng)業(yè)公司,就沒有必要卷入這場價(jià)格競爭。
一位頭部 VC 機(jī)構(gòu)的投資人也認(rèn)為,智譜 AI 面向的主要是企業(yè)客戶,因此它調(diào)整價(jià)格以適應(yīng)市場是符合邏輯的。相較而言,其他幾家 AI 創(chuàng)業(yè)公司專注于 C 端市場,它們的盈利并不完全依賴 API 銷售,自然沒必要趟這個(gè)渾水。
但對于那些靠賣 API 活著的創(chuàng)業(yè)公司,就難以保持從前的從容了。面對大廠的攪局和收入的減少,這些公司的市場空間逐漸縮小,必須開始尋找新的商業(yè)模式。
百川智能在發(fā)布新模型 Baichuan 4 時(shí),也同步推出了 AI 助手。這也意味著,百川正在尋求銷售 API 之外新的盈利模式,以應(yīng)對大模型低價(jià)戰(zhàn)。
獵豹移動董事長兼 CEO 傅盛也表示,這次大降價(jià)基本宣告了大模型創(chuàng)業(yè)公司必須尋找新的商業(yè)模式。降得最兇的都是有云服務(wù)的大公司,通過大模型來獲取云客戶," 羊毛出在豬身上,降得起 ",而大模型創(chuàng)業(yè)公司沒有這樣的生態(tài),必須另尋商業(yè)模式。
2024 北京智源大會上,幾位頭部大模型初創(chuàng)公司創(chuàng)始人同臺論道。攝影:趙一帆
技術(shù)的差距,也是一些創(chuàng)業(yè)公司打不出低價(jià)牌的重要原因。算法的不斷優(yōu)化,使得大模型的訓(xùn)練和推理效率得到提升,這直接導(dǎo)致了成本的大幅下降。
從算法邏輯來看,傳統(tǒng) Transformer 架構(gòu)的大模型運(yùn)作起來,就像一個(gè)不論任務(wù)大小,總是啟動所有機(jī)器的工廠,這種無差別的運(yùn)作方式容易導(dǎo)致資源的浪費(fèi)。
而打響價(jià)格戰(zhàn)的深度求索,采用了更聰明 MoE 算法架構(gòu)。在這種模式下,工廠可以實(shí)現(xiàn)資源的精準(zhǔn)分配,只需特定的機(jī)器,其他機(jī)器保持待命狀態(tài)就好。更加智能的分工,優(yōu)化了成本和效率,這也是它能夠提供更低價(jià)格產(chǎn)品的關(guān)鍵。
零一萬物的 CEO 李開復(fù)對大模型成本下降持肯定態(tài)度。他在接受采訪時(shí)表示:" 未來整個(gè)行業(yè)的推理成本每年降低 10 倍是可以期待的,而且也應(yīng)該是必然發(fā)生的。"
頭部云廠商的中層管理者田夢怡更謹(jǐn)慎看待這個(gè)問題。她告訴我們," 在過去兩年,大廠在模型訓(xùn)練和推理的提效上,每年降低到之前的 1/10 是正常的,但未來空間可能也沒多大了。"
此外,大廠憑借長期積累所構(gòu)建的生態(tài),也是創(chuàng)業(yè)公司難以快速復(fù)制的競爭優(yōu)勢。參戰(zhàn)的云廠商,客戶眾多,商業(yè)模式多元,有能力同時(shí)響應(yīng)不同的需求,通過提高資源利用率,進(jìn)一步壓縮了成本。
田夢怡解釋道:" 大廠可以超賣,可以自用和售賣結(jié)合,這是龐大業(yè)務(wù)規(guī)模帶來的騰挪空間,也是其掙錢的重要來源,小廠沒有這種條件和人才。"
以阿里云為例,為了提高資源利用率,其研發(fā)出了 " 動態(tài)資源超賣 " 的技術(shù)。簡單來說,就像一個(gè)智能監(jiān)控系統(tǒng),可以實(shí)時(shí)查看服務(wù)器資源的使用情況,在不影響服務(wù)質(zhì)量的情況下,將同一資源分配給更多用戶。不僅極大降低了單位成本,也為其提供了更大的降價(jià)空間。
大廠完備的供應(yīng)鏈體系和配套服務(wù),也成為創(chuàng)業(yè)公司難以跟隨的障礙。
大模型從接入到部署,具有一定技術(shù)門檻,不是每個(gè)企業(yè)客戶都具有這些能力。大廠通過提供模型服務(wù)和開發(fā)工具,助力企業(yè)更快地部署和開發(fā)。同時(shí),企業(yè)還能利用大廠平臺發(fā)布新應(yīng)用,借助其用戶基礎(chǔ)來增加曝光和流量。
綜合看,大模型降價(jià),大廠更有實(shí)力,也更有動力。對創(chuàng)業(yè)公司來說,性價(jià)比卻不高。
大模型降價(jià),到底圖什么?
在大模型的世界里,時(shí)間仿佛被壓縮。僅僅花了一年時(shí)間,大模型廠商們就從技術(shù)競爭迅速過渡到了比價(jià)大戰(zhàn)。
多家云廠商負(fù)責(zé)人公開表示,降價(jià)是希望吸引更多開發(fā)者,加速 AI 應(yīng)用的爆發(fā)。但事實(shí)果真如此么?他們又為何選擇這一時(shí)間點(diǎn)降價(jià)?降價(jià)究竟有沒有用,又能持續(xù)多久?
To C 流量難增長、To B 業(yè)務(wù)難掙錢,成為點(diǎn)燃價(jià)格戰(zhàn)的導(dǎo)火索。
隨著時(shí)間推移,業(yè)界開始意識到,僅靠一個(gè)交互式聊天窗口是無法持續(xù)吸引用戶的。傅盛的說法,也印證了這一事實(shí)。他表示:" 現(xiàn)在各個(gè)大模型 App 基本都是免費(fèi)的,本質(zhì)上應(yīng)該是各個(gè)大模型 App 用戶量漲不動了,包括 OpenAl。"
而大模型在 B 端的應(yīng)用場景又太少,在日常工作生活里,其實(shí)很少能感受到大模型能力的落地。
一位火山引擎內(nèi)部人士向我們透露,國內(nèi)大模型賣 API 的 To B 收入,現(xiàn)在非常少,相比訓(xùn)練側(cè)的投入可以說是杯水車薪。
因此,降低定價(jià)其實(shí)是一種營銷策略,目的是讓更多開發(fā)者先把大模型用起來。比如,要用 100 億 tokens 打磨一個(gè)業(yè)務(wù)場景,以前要花 100 多萬,起碼得立項(xiàng)審批到副總,還有很大概率會失敗。現(xiàn)在 8000 塊錢就能做,小組長就能批。
這樣做的好處是,可以快速地吸引到開發(fā)者,應(yīng)用多了,需求也就多了,他們才愿意為后續(xù)的服務(wù)付費(fèi)。
從短期角度來看,降價(jià)策略可能會導(dǎo)致賠本。然而,官方口徑的背后,打包出售整套云服務(wù)、提振公有云業(yè)務(wù)才是降價(jià)背后的長期目標(biāo)。
上述投資人和田夢怡都認(rèn)為,價(jià)格戰(zhàn)的玩家都是在用降價(jià)來換市場空間。用大模型客戶撬動公有云業(yè)務(wù)雖然是未來,但是要先保證自己在餐桌旁,否則就在餐桌上了。
對于客戶來講,打折的大模型固然誘人,但模型性能仍是決定購買的關(guān)鍵。
Max 是一家 AI 教育創(chuàng)業(yè)團(tuán)隊(duì)的聯(lián)合創(chuàng)始人,該團(tuán)隊(duì)致力于構(gòu)建學(xué)習(xí)能力分析模型,從而提供更加個(gè)性化、數(shù)據(jù)驅(qū)動的教育服務(wù)。在談及團(tuán)隊(duì)的選購標(biāo)準(zhǔn)時(shí),他表示,會先看模型能不能完成場景任務(wù),然后才會橫向?qū)Ρ葍r(jià)格、穩(wěn)定性,最終選出一個(gè)性價(jià)比最高的產(chǎn)品。
但 API 作為開發(fā)過程中的一項(xiàng)大額開支,降價(jià)確實(shí)能幫助開發(fā)者以更低成本構(gòu)建應(yīng)用。" 降價(jià)的吸引力確實(shí)很大,它給很多過去難以達(dá)成盈利的項(xiàng)目帶來了機(jī)會。"Max 坦言。
Max 的團(tuán)隊(duì)在 API 價(jià)格調(diào)整后,也享受到了實(shí)實(shí)在在的好處。在價(jià)格調(diào)整之前,他們每月調(diào)用 GPT 的成本在一萬元左右。但隨著價(jià)格的降低,他們轉(zhuǎn)而使用了智譜的 GLM 和 DeepSeek 的服務(wù)。即便他們的調(diào)用量有所增加,整體成本卻下降了 30%。
目前來看,價(jià)格的下降暫時(shí)還沒有剎車的跡象。上述投資人判斷,不管是從技術(shù)還是從市場看,降價(jià)都是可持續(xù)的,并且不好說 " 底 " 在哪里。
正如滴滴和快的通過合并結(jié)束了燒錢的補(bǔ)貼戰(zhàn),美團(tuán)也以其創(chuàng)新和激進(jìn)的市場策略在團(tuán)購大戰(zhàn)中嶄露頭角。大模型行業(yè)的價(jià)格戰(zhàn)可能會一直持續(xù)下去,直到某個(gè)突破性的殺手級應(yīng)用或場景出現(xiàn),才能宣告結(jié)束。
在這一決定性的時(shí)刻到來之前,不斷轉(zhuǎn)動的車輪下,將有無數(shù)企業(yè)被市場淘汰。
來源:鏡相工作室