在近日舉辦的 2024 年云棲大會上,阿里再次成為了焦點。
今年 5 月,阿里云宣布旗下通義千問的多款商業化及開源模型進行大幅降價,最高降價幅度高達 97%;云棲大會上,通義千問三款主力模型再次大幅降價,最高降幅達 85%。
自阿里在 5 月率先 " 開卷 " 之后,字節跳動旗下云服務火山引擎、百度智能云、騰訊云、科大訊飛等均官宣旗下大模型大幅下調價格,行業降價幅度達到了 90% 左右。
不僅國內大模型廠商跟進價格戰,行業風向標 OpenAI 也在今年 7 月推出了 GPT-4o mini ,商用價格較 GPT-3.5 Turbo 便宜了 60% 以上。
可以預見,在阿里再掀 " 價格戰 " 之后,大模型價格還將繼續下調,甚至可能走向 " 負毛利 "。在互聯網行業的發展史中," 虧本換規模 " 并不是某個企業的孤例,要改變整個行業的商業模式,必然需要投入更高的成本。
但在這個過程中,如何平衡價格、質量與服務也成為了大模型企業必須思考的問題,企業想要 " 活下來 ",就不能只吃 " 低垂的果實 "。
01 規模比利潤更重要
國內大模型已從 " 以分計價 " 的定價模式走向 " 以厘計價 " 的新時代。今年 5 月,阿里通義千問大模型的 API 調用輸出價格,從 0.02 元 / 千 Tokens 降至 0.0005 元 / 千 Tokens。
在 9 月再次降價之后,阿里云 Qwen-Turbo ( 128k ) 、Qwen-Plus ( 128k ) 、Qwen-Max 三款模型每千 tokens 的最低調用價格再次刷新下限,分別降至 0.0003 元、0.0008 元、0.02 元。
對于再次降價,阿里云 CTO 周靖人表示,每一次降價都是一個非常嚴肅的過程,要從整個產業發展,開發者、企業用戶的反饋等各方面進行權衡,(降價)不是 " 價格戰 ",(大模型價格)還是太貴了。
隨著一個行業的成熟發展,其走向降價趨勢也是必然的,比如半導體行業的 " 摩爾定律 ",即處理器的性能大約每兩年翻一倍,但工藝的進步會使成本下降為之前的一半。
但目前來看,大模型行業的降價速度已經遠超 " 摩爾定律 ",降價幅度接近 100%,在這樣的背景下,大模型企業還能盈利嗎?或許對大模型行業來說,當前規模比利潤更重要。
一方面,暫時讓渡利潤已是大模型行業的共識,業內人士認為,大模型行業甚至可能已經到了 " 負毛利時代 "。
據《財經》雜志報道,阿里云、百度智能云等多位負責人曾透露,今年 5 月以前,國內大模型推理算力毛利率高于 60%,和國際同行基本一致,但在 5 月接連降價后,毛利率則跌至負數。
在大模型降價以后,使用者數量會持續增多,短期內調用次數越多,大模型的虧損就越大,因為每次調用模型都要消耗價格不菲的算力,也就是說大模型企業不僅要降低售價,還要面臨更高的成本投入。
但另一方面,大模型降價帶來的效果也是顯著的。以阿里云為例,在大模型降價以后,阿里云百煉平臺的付費客戶數比上一個季度增長了超過 200%,更多企業放棄私有化部署,選擇在百煉上調用各類 AI 大模型,目前百煉已服務超 30 萬個客戶。
過去一年,百度文心大模型的降價幅度也超過 90%,不過,百度在 2024 年 Q2 財報電話會上披露,文心大模型日均調用量超 6 億次,半年內增長超 10 倍。
如此看來,大模型企業寧愿犧牲利潤也要降價,所求的正是 " 預期 ",即犧牲短期利益來換取長期回報。
有業內人士估計,目前各家大模型企業在模型調用領域的收入不會超過 10 億元,相較于百億元級別的總營收,這筆收入只是 " 九牛一毛 "。
但在未來 1-2 年,大模型調用次數至少有 10 倍以上的指數級增長,短期來看,用戶規模越大,大模型的算力成本越高;但長期來看,在云服務領域,算力成本有望隨著客戶需求增長逐漸攤薄,企業將會迎來 " 回報期 "。
隨著行業的持續發展,AI 對算力的拉動會越來越明顯,阿里 CEO 吳泳銘曾表示,在算力市場上,超過 50% 的新需求都是由 AI 驅動產生的,大模型正在加速商業化。
一方面,降價大大降低了企業客戶的使用門檻和試錯成本,特別是對政務、制造、能源等傳統行業來說,它們的業務規模更大,增量空間也更大。
當大模型能夠像其他基礎設施一樣人人可用時,大模型的市場空間才能有望實現大幅增長,在這之前,大模型企業難免需要讓利給企業和開發者。
另一方面,大模型降價后存量收入會下降,但增量收入會增長。以百度為例,大模型不僅帶來了直接收入,比如文心大模型等產品的調用等,還能帶動間接業務的收入,比如百度智能云業務。
過去幾年,外界對百度智能云戰略不乏質疑,其在公有云市場并不占優勢,但在 AI 公有云這個細分市場,百度開始彎道超車。目前,百度智能云的大模型收入占比已從 2023 年四季度的 4.8% 提升到了 2024 年二季度的 9%。
所以,目前大模型行業的共識,就是規模比利潤更重要,這一觀點在互聯網時代也是老生常談,比如 " 千團大戰 "" 網約車大戰 "" 電商大戰 " 等。大模型企業不能回避 " 價格戰 ",就只能將活過價格戰作為初步目標,希望能成為淘汰賽結束后的最終受益者。
02 阿里著力 "AI 大基建 "
阿里也深知這一道理,其在近日宣布大模型再次降價后,也提出了 "AI 大基建 " 的概念。阿里云副總裁張啟表示,現在的 AI 相當于 1996 年前后的互聯網,當時的上網資費很貴,這也限制了移動互聯網的發展,只有把資費降下來,才有可能談未來的應用爆發。
所以,阿里除了在 2024 年云棲大會上提出大模型再次降價之外,還發布了新一代的開源大模型,一口氣上架了 100 多個模型,涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型,創造了大模型開源的 " 數量之最 "。
阿里云 CTO 周靖人表示,阿里云堅定不移地推進開源戰略,希望把選擇留給開發者,讓開發者會基于自己的業務場景去做模型能力增強和推理效率增強的權衡與選擇,同時也能更有效服務企業。
根據阿里的統計,截至 2024 年 9 月中旬,通義千問開源模型下載量突破 4000 萬,Qwen 系列衍生模型總數超過 5 萬個,成為僅次于 Llama 的世界級模型群,而 Llama 正是大模型開源界的 " 頭把交椅 ",全球下載量接近 3.5 億。
在 " 百模大戰 " 結束之后,多位行業大佬均認為 " 卷模型不如卷應用 ",大廠也開始聚焦 " 卷生態 "。百度董事長李彥宏曾表示," 沒有構建于基礎模型之上的、豐富的 AI 原生應用生態,大模型就一文不值。"
目前,通過國家網信辦備案的大模型已達 190 多個,注冊用戶超 6 億,但仍難以解決大模型 " 最后一公里 " 問題,難點不僅是大模型應用太少,還有大模型不夠 " 接地氣 ",比如在醫療、金融等專業領域中,單純依靠 " 喂數據 " 訓練,大模型還是很難直接落地應用。
大廠不可能躬身入局每一個細分行業來完成 " 最后一公里 ",但可以通過打造完整的應用生態,由下游企業或其他開發者自行 " 煉成 " 符合需求的模型產品,不僅能進一步優化資源配置,也能在這個過程中積累更多高質量數據,最終反哺給基礎大模型開發。
阿里選擇降價、開源,本質就是希望降低大模型的使用門檻,通過更低的價格來驗證大模型的應用價值,讓更多企業和創作者參與進來。只有大模型能夠真正滿足企業的復雜業務場景需求,生態才能發展起來,行業才能進入新的階段。
不過," 百模大戰 " 最終可能只會留下 3-5 家大模型企業,目前來看,行業第一梯隊已經呼之欲出,它們也可能會是大模型行業未來最基本的底座。
因此,頭部的大模型企業更不可能主動放棄價格戰,讓出自己的市場份額。除此以外,不少獨角獸也希望憑借價格戰殺出一條 " 生路 ",部分企業也認為小模型或更具性價比。
事實上,今年 5 月的大模型價格戰并非始于阿里,而是一條名為 "DeepSeek V2" 的鯰魚,在行業普遍推理價格還是百元 /Tokens 的背景下,其將支持 32k 上下文的模型 API 定價為 1 元 / 百萬 Tokens(計算)、2 元 / 百萬 Tokens(推理)。
目前來看,大模型淘汰賽或還會持續 2-3 年,雖然最終留下的大模型企業并不會多,為了活下去,企業們也不得不使出渾身解數,但問題是,當 " 低垂的果實 " 都被摘完之后,當下大模型行業的解題思路早已不是 " 便宜就完事 "。
03 0 模型能力仍是關鍵
不過,對于大模型 " 價格戰 " 一事,行業也有不同的看法。零一萬物創始人李開復曾表示,沒有必要打瘋狂的價格戰,因為大模型不光要看價格,還要看技術,如果是技術不行,然后靠賠錢來做生意,(公司)不會對標這樣的定價。
火山引擎總裁譚待在談及價格戰時也表示,當前主要關注的是應用覆蓋,而不是收入,要有更強的模型能力才能解鎖新場景,這才更有價值。
目前來看," 價格戰 " 的本質還是因為產品能力不足,各家模型能力趨于同質化,暫時無法形成斷檔的差距,所以才希望通過價格戰來增加大模型的普及,也能幫助廠商增加市場份額。
但等到市場摘完 " 低垂的果實 ",新問題也會接踵而來,企業能否扛下下一階段的價格戰;大模型能否和對手拉開差距;自己會否成為最終能夠留下來的企業,這些問題依然需要解決。
所以,大模型企業在打價格戰的同時,也深知產品、技術、現金流的重要性,既要抗住降價壓力,又要和對手拉開技術差距,持續提升模型性能和產品落地,才能形成良性的商業閉環。
一方面,大模型企業并非單純依賴 " 價格戰 "。通常來說,大模型的推理包含時間、價格、生成 Token 數量三個變量,不能拋開單位時間內的并發數量,只看 tokens 價格。
因為在實際跑業務的過程中,推理事件越復雜,越有可能要增加并發量。但目前降價大模型普遍使用的是預置模型(不支持增加并發量),真正大規模、高性能、支持高并發的模型推理均未有大幅降價。
另一方面,通過技術來進一步優化大模型的推理成本。以百度為例,旗下的百舸異構計算平臺對智算集群的設計、調度、容錯等環節進行了專項優化,能夠實現萬卡集群上的模型有效訓練時長占比超過 98.8%,線性加速比、帶寬有效性分別高達 95%,幫助客戶解決算力短缺和算力成本偏高等問題。
微軟 CEO 薩蒂亞 · 納德拉曾舉例表示,過去一年 GPT-4 性能提升了 6 倍,但成本降低到了之前的 1/12,性能 / 成本提升了 70 倍。不難看出,大模型技術的發展才是行業持續降價的底氣。
最后,則是打造出更有差異化的產品。低價策略能夠幫助大模型企業筑造生態,但隨著 AI 領域的不斷發展,創新速度的加快也使得技術更新換代周期縮短,是否能夠持續提供有競爭力的產品,能否在實際應用中解決用戶痛點,才是大模型企業的核心競爭力。
目前,大模型行業的商業邏輯,已經從卷模式、卷成本,邁入到卷生態、卷技術的新階段。當然,低價還是快速建立生態壁壘的重要手段,但通過技術降低成本,才是推動大模型快進到 " 價值創造階段 " 的關鍵要素。
接下來,大模型企業的新戰場將會是 " 性價比 ",要在當前的價格基礎上,進一步提高大模型的質量和性能,讓模型能力更強、更多元,這么做或許不一定能孵化出 " 超級應用 ",但吸引更多中小企業、創業公司的加入,才有機會為大模型企業帶來爆發式增長的機會。
來源:伯虎財經