有人預料到 DeepSeek 能引爆全球嗎?至少,DeepSeek-V3 發布前,在大模型戰場前線 " 賣鏟子 " 的袁進輝心里也是打鼓的。
1 月 28 日,他在社交媒體上回憶起一個故事:DeepSeek 爆火前一個月,梁文鋒曾建議硅基流動部署 DeepSeek-V3,至少準備 20 臺 H800,80 臺最好。袁進輝迅速算了算賬,一個月 80 臺 H800 服務器就要支出五六百萬的算力成本,這些機器還不一定能用滿。" 風險太大了,就沒下注。"
隨后 DeepSeek 火爆全球,洶涌的流量讓其官網和 App 很快崩潰,熱情的用戶急于找到能正常使用 DeepSeek 的渠道。袁進輝感慨:" 現在 DeepSeek 這么火,決策失誤,欲哭無淚。"
很快,這種懊悔轉變成強大的行動力。苦于算力不足的硅基流動找到華為,全力完成 DeepSeek-R1 & V3 在昇騰芯片上的適配工作。整個春節期間,硅基流動團隊沒有休息過一天。
他們的動作夠快,承接住了第一波流量。2 月 1 日,硅基流動首發了基于華為昇騰算力的滿血版 DeepSeek-R1 & V3,迅速吸引了大批開發者和個人用戶。
△圖源:SimilarWeb
這是一次巧妙的合作,一舉掃清市場對于國產芯片性能瓶頸的疑慮,證明了在國產芯片上部署 DeepSeek,也可以獲得持平全球高端 GPU 部署模型的效果。同時,這次合作無意間觸發了一場國產替代的狂歡。
硅基流動也借此證明了自己的 AI Infra 實力。" 尤其這次上線 DeepSeek R1 & V3 之后,涌過來的合作線索,暫時都看不過來。" 袁進輝說。
就在硅基流動爆火之前, 《智能涌現》獲悉,硅基流動(SiliconFlow) 在 2024 年底 就已完成億元人民幣 Pre-A 輪融資,由華創資本領投,普華資本跟投,老股東耀途資本繼續超額跟投,華興資本擔任獨家財務顧問 。
值得注意的是,本輪融資之前,硅基流動已引入美團作為戰略股東。
2024 年 8 月,《智能涌現》曾采訪過創始人袁進輝,當時硅基流動正好成立一周年,剛發布 MaaS 平臺 SiliconCloud。
你可以將 SiliconCloud 想象為一個 " 大模型 API 超市 ",開發者只需要注冊賬號,選擇自己想要的模型,就可以開發應用,免去購買服務器的負擔。甚至,經過硅基流動適配和優化后的模型,還能做到比原廠模型響應更快、推理成本更低。
在這一年間,硅基流動經歷了起碼十倍的市場增長。SiliconCloud 已經獲得了超三百萬的用戶,日均調用上千億 Token ——去年剛上線時,這個數字還是日均百億。
△圖源:硅基流動
在開發者圈子中,硅基流動有著良好的口碑,因提供親民價格和優異性能的模型服務被稱為 " 賽博菩薩 "。現在,SiliconCloud 已經上線了包括滿血版 DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice 等在內的上百款主流模型,也提供模型訓練、微調、托管到部署的全套工具,滿足開發者及企業客戶的不同應用場景需求。
2024 年 7 月,硅基流動也推出了一款新產品:基于 ComfyUI 的云節點插件 BizyAir。
BizyAir 是一款圖像生成工具,能夠讓 AI 開發者與創作者無需考慮顯卡和環境限制,即可直接使用云計算資源完成生圖任務。截至目前,BizyAir 支持數十種模型,支持 ComfyUI 本地節點混跑,已經獲得了近萬名用戶。
硅基流動在這一年間也開始了 To B 商業化擴展,與華為、亞馬遜云科技、英偉達等頂級云廠商、芯片廠商、大模型公司及應用公司建立了合作伙伴關系。
企業服務方面,硅基流動已經在大語言模型、文生圖、視頻生成等多個場景,有標桿客戶案例的落地。硅基流動目前提供四種服務模式,包括專屬實例、算力納管、私有版 MaaS、基于華為昇騰 910 系列 NPU 的一體機。
毫無疑問,DeepSeek 已經一掃 2024 年大模型領域的陰霾,一場宏大征程的序幕已經展開。2024 年,袁進輝曾對《智能涌現》表示,在 GPT-4o 出來后,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯推理能力。
OpenAI o1、DeepSeek R1 的出現,意味著大模型在 " 邏輯能力 " 這個問題上前進了一大步,這對應用市場是巨大利好。
" 可以預期,國內外基于 DeepSeek 的應用將爆發,這一天終于要到來了。" 袁進輝說。
以下為《智能涌現》與創始人袁進輝的問答:
《智能涌現》 :上一輪融資之后,硅基流動在產品方面有什么節點性的進展?關鍵性能提升的程度如何?
袁進輝 :主要是適配了華為昇騰芯片、開源了 ComfyUI 云節點 BizyAir,以及持續上線最新模型,并且上線了模型微調、托管等功能。
底層推理框架的性能依然保持業內領先,性能優化是一項需要長期、持續性投入的工作。
《智能涌現》 :推出相關產品后,市場都有怎樣的反饋?商業落地上有什么關鍵性進展?
袁進輝 :SiliconCloud 獲得了爆發式增長,目前平臺有超三百萬用戶,日均調用超千億 Token;BizyAir 在沒做什么推廣的情況下獲得了近萬名用戶。
商業落地方面,尤其這次上線 DeepSeek R1 & V3 之后,涌過來的合作線索暫時都看不過來。
《智能涌現》 :去年 7 月硅基流動上線了 BizyAir,為什么會推出這個產品?戰略定位是什么?
袁進輝 :BizyAir 是一個意外驚喜。起初,這是一個試驗性項目,其實還是幫助用戶用高性價比的推理服務資源,更方便地進行生圖。在 BizyAir 之前,我們開源的圖片 / 視頻生成推理加速組件 OneDiff,由于性能好、靈活、支持模型豐富,已經有較好的口碑。在做 OneDiff 的過程中,我們了解到生圖用戶的常見痛點,包括出圖慢、工作流組合繁瑣、上手門檻高等,所以我們嘗試開發了 BizyAir,發布后受到了不少用戶的喜愛以及自發傳播。
《智能涌現》 :去年你說,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯。Deepseek V3 之后,是不是邏輯能力也做得足夠好了,2025 年會迎來現象級的應用嗎?
袁進輝 :那時還沒有 OpenAI o1、DeepSeek-R1。它們的發布已經展示出模型的強大邏輯推理能力,并且 DeepSeek-R1 把思考過程完整地展示了出來,看上去更像是一個有思辨能力的人在思考。
現在,開發者基于標準 API 可以做很多很酷的應用了,可以預期,國內外基于 DeepSeek 這樣的開源模型的應用將爆發,這一天終于要到來了。
《智能涌現》 :最近硅基流動迅速基于昇騰上線了 DeepSeek,春節期間也有大量開發者涌入,你們在前線看到的情況是怎么樣的?
袁進輝 :我原本以為我們能接住這波用戶,但市場對 DeepSeek-R1 & V3 的需求量太大了,目前不得不對免費用戶進行限流,當然,我們也在積極擴展資源,希望能讓用戶敞開用。
我們作為一個面向開發者與企業客戶的 API 平臺,但是光官網的 Playground 就有幾十萬日活,可見 DeepSeek 需求量之大。
《智能涌現》 :很多第三方企業宣布接入 DeepSeek-R1 & V3 ,但為什么實際能提供滿血版的企業很少?
袁進輝 :一方面,部署滿血版 DeepSeek R1 & V3 需要的算力資源非常大,用 80 臺 H800 來部署,每月需要五六百萬的算力成本,一般企業與其自己本地部署,顯然接入硅基流動 SiliconCloud 這樣的云服務 API 更劃算;
另一方面,要部署 DeepSeek R1 & V3 這樣的 MoE 模型技術挑戰很大,需要專業的 AI Infra 團隊才能部署成功且把性能優化得很好,硅基流動 SiliconCloud 曾是國內最早部署上線 DeepSeek 模型的第三方平臺,也是首個在國產芯片上適配部署 DeepSeek-R1 & V3 的 AI Infra 公司。
來源:36氪