國內大模型公司,也沒有錯過今年的 618。
" 降價 97%!"" 免費!" 過去一個月,各大國產大模型廠商喊出了不要錢的架勢,降價之狠,讓外行驚嘆。
誰也沒想到,這場價格大戰是由一家本不在牌桌上的公司掀起的。
5 月 6 日,知名私募機構幻方量化創立的大模型公司 " 深度求索 "(英文名:DeepSeek),發布了第二代 MoE 模型 DeepSeek-V2。模型迭代的同時,其 API 調用價格直接降至每百萬 tokens 輸入 1 元、輸出 2 元。
僅為 GPT 4-Turbo 百分之一的定價,讓這家公司在 AI 界迅速嶄露頭角,也讓一眾互聯網大廠和大模型獨角獸坐不住了。
不出半個月,智譜 AI、字節跳動、阿里云、百度、騰訊云、科大訊飛等頭部玩家紛紛加入降價行列,你追我趕地大舉下調了模型價格。
這番場景,讓人不禁回憶起 ofo 和摩拜的 " 單車之爭 "、滴滴與快的的 " 合并之戰 "。短短兩年間,大模型這場不見硝煙的戰爭,似乎也步入了最簡單粗暴的階段。
然而,這場聲勢浩大的降價潮,究竟是單純的成本讓利,還是一場精心策劃的營銷之戰?為何一眾大廠迅速響應,大部分初創公司卻持觀望態度?大模型客戶們真的能從這波降價中獲益嗎?參與降價的企業,真正的目的是什么?
真降價還是假噱頭?
截至發稿,公開宣布參與本次價格戰的公司共有 7 家,其中包括字節、騰訊、阿里、百度四家互聯網大廠,大模型創業公司 " 智譜 AI"、老牌 AI 上市公司 " 科大訊飛 ",以及這次價格戰的發起者 "DeepSeek"。
鏡相工作室研究發現,這波來勢洶洶的價格大戰,不像宣傳中那么簡單直降,而是一場精心計算的策略游戲。
首先,降價最狠的基本都是入門級的基礎模型,而那些最高配的模型其實并不打折。
每家大模型公司,都有一個 " 模型家族 ",里面有性能不一的通用模型,也有擅長某些場景的專用模型。比如 OpenAI 旗下的 GPT-3.5 和 GPT-4,以及文生視頻模型 Sora。
以百度為例,百度宣布降價的兩款大模型,分別是適合在特定場景作為基座模型進行精調的輕量級模型 ERNIE Speed,和參數更小、適合搭載在低算力卡上的 ERNIE Lite。而最新發布的超大規模模型 ERNIE 4.0 系列并未降價。
最先坐不住的智譜 AI,第一次宣布降價的也是其最基礎的模型 GLM-3 Turbo,最先進的 GLM-4 并未搬上價格戰的牌桌。直到 6 月 5 日第二次降價,才將 GLM-4 系列中的圖生文模型 GLM-4V 加入降價行列,但最常用的對話版模型依然沒有降價。
巧的是,部分公司降價的,也只是輸入部分的 tokens 使用量,輸出部分的價格不僅沒降價,還在各家打出的降價廣告語中被悄悄隱藏了。
在 API 調用中,推理費用的具體定價,分成 " 輸入 " 和 " 輸出 " 兩部分。輸入指的是,用戶向大模型提出的問題,輸出則是大模型給出的答案。
例如騰訊的混元 -Pro 大模型,雖然輸入價格大幅下降了 70%,但輸出價格并未優惠,依舊保持原價。同樣,阿里云的 Qwen-Max 模型輸入價格下調了 67%,輸出費用也維持不變,沒有折扣。
在各家的宣傳里,有不少是拿自己降價的模型與別家最貴的模型作對比,才有了動輒 " 比行業水平便宜 90%" 的降價幅度,讓外界以為下了血本讓利客戶。實際上,模型之間性能不同、使用場景不同,有的降價是真有用,有的更多只是一個營銷噱頭。
其次,同一個模型不同的交付模式,也對應著不同的價格。根據使用場景、部署方式和用戶需求,大模型的交付模式通常會分為基礎服務、進階服務和高階服務。
基礎服務指的是,用戶直接調用平臺已經預設好的 API,來使用模型的功能。而進階服務意味著,用戶可以把模型部署到自己的服務器或云平臺上,然后根據使用場景對模型進行微調,可以理解為定制產品,在特定任務上的性能和準確性會更高。
當用戶覺得,大模型的響應速度不夠快時,可以選擇高階服務,不再需要和其他人搶計算資源,用戶可以獨占所有計算資源,來確保調用頻率和響應時長滿足業務訴求。
目前各家企業大幅降價的焦點,更多集中在基礎服務,即直接調用預置模型進行推理。如果初級服務無法滿足需求,就需要更高級的模型微調和部署服務,這部分其實并未降價。
以阿里云參與降價的通義千問主力大模型 Qwen-Long 為例,降價只針對基礎服務。對于尋求更高級服務的用戶來說,需要轉向其他模型產品,因為 Qwen-Long 模型本身不支持微調和自定義部署。
而百度宣布的兩款免費模型,僅限于初級的平臺預置服務階段。一旦用戶需要模型部署或進一步的精調服務,免費優惠便不再適用。
以百度的 ERNIE Speed 模型為例,雖然基礎服務免費,但一旦用戶升級至進階服務,費用即提高到 0.005 元 / 千 tokens。若用戶選擇更高級的服務,價格則進一步增至 0.008 元 / 千 tokens。隨著服務級別的提升,費用也會相應增加。
一分錢一分貨,想要得到更高級的服務,用戶就需要花費更多的錢。進階服務和高階服務,一般依照消耗的計算資源來計費,即實際訓練過程中使用的計算資源和訓練時長。
以智譜 AI 的 ChatGLM-130B 模型的私有化部署為例,企業用戶一年需要支付高達 3960 萬元的費用。這一價格顯然只有具備一定規模和財力的大型企業客戶才能承擔。
因此,這一波降價,只能說降低了企業用戶使用大模型的門檻,利好一些個人開發者和小創業公司,真要大規模使用大模型,依舊省不下太多錢。
為什么創業公司不參與價格戰?
與火藥味十足的大廠相比,資金有限的初創公司顯得更為冷靜。
除了智譜 AI 之外,包括百川智能、月之暗面、零一萬物在內的幾家頭部大模型初創公司并未加入降價行列。MiniMax 雖然宣布了價格調整,但僅針對其語音模型進行了調整,文本大模型的價格則保持不變。
創業公司是否跟風降價,主要得看幾個條件:一要看商業模式,有沒有必要跟;二要看技術能力,能不能跟得動;三要看生態,能不能跟下去。
商業模式決定收入來源,大模型企業主要有兩種盈利途徑:一是面向企業客戶(B 端),銷售 API 服務或定制化大模型;二是直接面向消費者(C 端),提供終端產品。
出售 API,是大模型公司常見的賺錢方式。企業訓練出自己的模型后,通過 API 將其功能提供給開發者或企業。這樣,開發者無需從頭開始訓練模型,只需輸入自己的數據進行微調,便能迅速開發出定制化的應用程序。因此,降價主要受益的是開發者和企業客戶,對普通消費者沒有直接影響。
以 C 端市場為主戰場的創業公司,就沒有必要卷入這場價格競爭。
一位頭部 VC 機構的投資人也認為,智譜 AI 面向的主要是企業客戶,因此它調整價格以適應市場是符合邏輯的。相較而言,其他幾家 AI 創業公司專注于 C 端市場,它們的盈利并不完全依賴 API 銷售,自然沒必要趟這個渾水。
但對于那些靠賣 API 活著的創業公司,就難以保持從前的從容了。面對大廠的攪局和收入的減少,這些公司的市場空間逐漸縮小,必須開始尋找新的商業模式。
百川智能在發布新模型 Baichuan 4 時,也同步推出了 AI 助手。這也意味著,百川正在尋求銷售 API 之外新的盈利模式,以應對大模型低價戰。
獵豹移動董事長兼 CEO 傅盛也表示,這次大降價基本宣告了大模型創業公司必須尋找新的商業模式。降得最兇的都是有云服務的大公司,通過大模型來獲取云客戶," 羊毛出在豬身上,降得起 ",而大模型創業公司沒有這樣的生態,必須另尋商業模式。
2024 北京智源大會上,幾位頭部大模型初創公司創始人同臺論道。攝影:趙一帆
技術的差距,也是一些創業公司打不出低價牌的重要原因。算法的不斷優化,使得大模型的訓練和推理效率得到提升,這直接導致了成本的大幅下降。
從算法邏輯來看,傳統 Transformer 架構的大模型運作起來,就像一個不論任務大小,總是啟動所有機器的工廠,這種無差別的運作方式容易導致資源的浪費。
而打響價格戰的深度求索,采用了更聰明 MoE 算法架構。在這種模式下,工廠可以實現資源的精準分配,只需特定的機器,其他機器保持待命狀態就好。更加智能的分工,優化了成本和效率,這也是它能夠提供更低價格產品的關鍵。
零一萬物的 CEO 李開復對大模型成本下降持肯定態度。他在接受采訪時表示:" 未來整個行業的推理成本每年降低 10 倍是可以期待的,而且也應該是必然發生的。"
頭部云廠商的中層管理者田夢怡更謹慎看待這個問題。她告訴我們," 在過去兩年,大廠在模型訓練和推理的提效上,每年降低到之前的 1/10 是正常的,但未來空間可能也沒多大了。"
此外,大廠憑借長期積累所構建的生態,也是創業公司難以快速復制的競爭優勢。參戰的云廠商,客戶眾多,商業模式多元,有能力同時響應不同的需求,通過提高資源利用率,進一步壓縮了成本。
田夢怡解釋道:" 大廠可以超賣,可以自用和售賣結合,這是龐大業務規模帶來的騰挪空間,也是其掙錢的重要來源,小廠沒有這種條件和人才。"
以阿里云為例,為了提高資源利用率,其研發出了 " 動態資源超賣 " 的技術。簡單來說,就像一個智能監控系統,可以實時查看服務器資源的使用情況,在不影響服務質量的情況下,將同一資源分配給更多用戶。不僅極大降低了單位成本,也為其提供了更大的降價空間。
大廠完備的供應鏈體系和配套服務,也成為創業公司難以跟隨的障礙。
大模型從接入到部署,具有一定技術門檻,不是每個企業客戶都具有這些能力。大廠通過提供模型服務和開發工具,助力企業更快地部署和開發。同時,企業還能利用大廠平臺發布新應用,借助其用戶基礎來增加曝光和流量。
綜合看,大模型降價,大廠更有實力,也更有動力。對創業公司來說,性價比卻不高。
大模型降價,到底圖什么?
在大模型的世界里,時間仿佛被壓縮。僅僅花了一年時間,大模型廠商們就從技術競爭迅速過渡到了比價大戰。
多家云廠商負責人公開表示,降價是希望吸引更多開發者,加速 AI 應用的爆發。但事實果真如此么?他們又為何選擇這一時間點降價?降價究竟有沒有用,又能持續多久?
To C 流量難增長、To B 業務難掙錢,成為點燃價格戰的導火索。
隨著時間推移,業界開始意識到,僅靠一個交互式聊天窗口是無法持續吸引用戶的。傅盛的說法,也印證了這一事實。他表示:" 現在各個大模型 App 基本都是免費的,本質上應該是各個大模型 App 用戶量漲不動了,包括 OpenAl。"
而大模型在 B 端的應用場景又太少,在日常工作生活里,其實很少能感受到大模型能力的落地。
一位火山引擎內部人士向我們透露,國內大模型賣 API 的 To B 收入,現在非常少,相比訓練側的投入可以說是杯水車薪。
因此,降低定價其實是一種營銷策略,目的是讓更多開發者先把大模型用起來。比如,要用 100 億 tokens 打磨一個業務場景,以前要花 100 多萬,起碼得立項審批到副總,還有很大概率會失敗。現在 8000 塊錢就能做,小組長就能批。
這樣做的好處是,可以快速地吸引到開發者,應用多了,需求也就多了,他們才愿意為后續的服務付費。
從短期角度來看,降價策略可能會導致賠本。然而,官方口徑的背后,打包出售整套云服務、提振公有云業務才是降價背后的長期目標。
上述投資人和田夢怡都認為,價格戰的玩家都是在用降價來換市場空間。用大模型客戶撬動公有云業務雖然是未來,但是要先保證自己在餐桌旁,否則就在餐桌上了。
對于客戶來講,打折的大模型固然誘人,但模型性能仍是決定購買的關鍵。
Max 是一家 AI 教育創業團隊的聯合創始人,該團隊致力于構建學習能力分析模型,從而提供更加個性化、數據驅動的教育服務。在談及團隊的選購標準時,他表示,會先看模型能不能完成場景任務,然后才會橫向對比價格、穩定性,最終選出一個性價比最高的產品。
但 API 作為開發過程中的一項大額開支,降價確實能幫助開發者以更低成本構建應用。" 降價的吸引力確實很大,它給很多過去難以達成盈利的項目帶來了機會。"Max 坦言。
Max 的團隊在 API 價格調整后,也享受到了實實在在的好處。在價格調整之前,他們每月調用 GPT 的成本在一萬元左右。但隨著價格的降低,他們轉而使用了智譜的 GLM 和 DeepSeek 的服務。即便他們的調用量有所增加,整體成本卻下降了 30%。
目前來看,價格的下降暫時還沒有剎車的跡象。上述投資人判斷,不管是從技術還是從市場看,降價都是可持續的,并且不好說 " 底 " 在哪里。
正如滴滴和快的通過合并結束了燒錢的補貼戰,美團也以其創新和激進的市場策略在團購大戰中嶄露頭角。大模型行業的價格戰可能會一直持續下去,直到某個突破性的殺手級應用或場景出現,才能宣告結束。
在這一決定性的時刻到來之前,不斷轉動的車輪下,將有無數企業被市場淘汰。
來源:鏡相工作室