中國儲能網(wǎng)訊:近期,中國人工智能初創(chuàng)企業(yè)——深度求索公司(DeepSeek)憑借其開源大模型R1及前代V3,成為撬動全球科技版圖的一把“新杠桿”。與硅谷“燒錢堆算力”不同,DeepSeek通過算法革命將模型訓(xùn)練成本降低了約60%,僅以557.6萬美元的純算力投入實(shí)現(xiàn)了性能對標(biāo)GPT-4o的成績,并以開源策略吸引全球開發(fā)者目光。業(yè)內(nèi)人士普遍認(rèn)為,“低成本、高精度”正在沖擊著以美歐企業(yè)為中心的AI敘事與競爭規(guī)則。
在這一背景下,從華爾街資本市場劇烈震蕩,到微軟、華為等巨頭火速適配DeepSeek的產(chǎn)品,“DeepSeek現(xiàn)象”早已不僅是一場新興技術(shù)突圍的故事,更成為國際科技競爭格局重塑的觀察窗口。它正向人們提出了新的問題——當(dāng)中國AI企業(yè)以算法創(chuàng)新突圍,全球AI賽道是否將迎來全新的規(guī)則重估?
嶄露頭角:
性能卓越,用戶體驗(yàn)佳
“起初以為又是炒作概念的AI產(chǎn)品,現(xiàn)在想想還是不可思議。”某科技公司數(shù)據(jù)分析師高天宇向中國城市報(bào)記者展示他手機(jī)端的DeepSeek應(yīng)用界面時(shí),依然難掩驚喜。作為一名95后科技愛好者,他在兩個(gè)月前偶然試用DeepSeek,原本想做一次簡單的新能源汽車市場分析,沒想到一段關(guān)于近五年政策變化的深度解析瞬間改變了他的看法。
“當(dāng)時(shí)要準(zhǔn)備行業(yè)報(bào)告,就隨口讓DeepSeek梳理近五年新能源汽車相關(guān)的中央及地方政策。”高天宇回憶道,“它先列出12項(xiàng)關(guān)鍵政策,然后結(jié)合動態(tài)數(shù)據(jù)模型,逐層推演對產(chǎn)業(yè)鏈的影響,最終還得出了‘2025年電池技術(shù)迭代窗口期’的觀點(diǎn)。這個(gè)系統(tǒng)層層遞進(jìn)的邏輯讓人眼前一亮,就像有個(gè)專家團(tuán)隊(duì)在幫我拆解問題,很多視角比專業(yè)咨詢報(bào)告還透徹?!?
現(xiàn)在,小高的工作界面里常駐兩個(gè)窗口——Excel和DeepSeek。他告訴中國城市報(bào)記者,平時(shí)撰寫材料會用DeepSeek來核對數(shù)據(jù)口徑,處理客戶需求時(shí)則讓它生成備選方案,甚至做PPT也會先讓AI搭好框架?!吧现苡袀€(gè)項(xiàng)目需要處理200份問卷的數(shù)據(jù),它用交叉分析法三分鐘就找出了潛在矛盾點(diǎn),以往得折騰半天?!彼蜷_工作日志,指著最近三個(gè)月的效率曲線,“項(xiàng)目交付效率整整提升了40%。”
更讓小高意外的是,這個(gè)“智能助手”無形中還拓寬了他的知識面?!扒疤旆治鲩L三角產(chǎn)業(yè)轉(zhuǎn)移,它又列舉德國魯爾區(qū)轉(zhuǎn)型案例,提醒我關(guān)注技術(shù)工人流動數(shù)據(jù)?,F(xiàn)在遇到復(fù)雜問題不先問問DeepSeek,總覺得缺了道‘保險(xiǎn)栓’。”說著,他又習(xí)慣性地點(diǎn)開DeepSeek,“這滿屏的行業(yè)術(shù)語和本土數(shù)據(jù),優(yōu)勢可不只是技術(shù)參數(shù)能體現(xiàn)的。咱們的‘東方力量’,真不比ChatGPT差!”
DeepSeek是啥
DeepSeek背后的核心研發(fā)力量,最初源自幻方量化在GPU訓(xùn)練量化交易模型方面的經(jīng)驗(yàn)?;梅搅炕菄鴥?nèi)率先囤積過萬塊高端GPU用于大模型研發(fā)的企業(yè)之一,GPU儲備規(guī)模甚至比肩國內(nèi)一線互聯(lián)網(wǎng)公司,遠(yuǎn)超國內(nèi)主流大模型創(chuàng)業(yè)團(tuán)隊(duì)。
DeepSeek在海外“出圈”,始于2024年12月的一系列重量級發(fā)布。當(dāng)月,公司推出了開源模型DeepSeek-V3,測試顯示該模型在多項(xiàng)評測中優(yōu)于主流開源方案,并且在保持高水準(zhǔn)的同時(shí)具備明顯的成本優(yōu)勢。其能力可與閉源的GPT-4o相近,但訓(xùn)練只用了2048張英偉達(dá)H800 AI芯片,純算力成本僅為557.6萬美元,比Meta發(fā)布的Llama-3-405B的一個(gè)訓(xùn)練周期還低了一個(gè)數(shù)量級。
時(shí)間進(jìn)入2025年1月,DeepSeek發(fā)布了對標(biāo)OpenAI最新推理模型o1的DeepSeek-R1,號稱在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上實(shí)現(xiàn)了新的“自發(fā)涌現(xiàn)”式推理能力,并將其免費(fèi)開源。與此形成鮮明對比的是,OpenAI、英偉達(dá)等巨頭正醞釀大規(guī)模算力基建計(jì)劃,涉及高達(dá)5000億美元的投資。這樣一來,DeepSeek的“純算法”打法令全球行業(yè)目光紛紛聚焦。
北京郵電大學(xué)人工智能學(xué)院人機(jī)交互與認(rèn)知工程實(shí)驗(yàn)室主任劉偉向中國城市報(bào)記者表示,DeepSeek的關(guān)鍵在于算法層面的突破和優(yōu)化,大幅節(jié)省了算力與數(shù)據(jù)需求?!叭绻fOpenAI是‘大力出奇跡’,DeepSeek則證明‘小力也能出奇跡’。”在產(chǎn)業(yè)普遍受到算力和資源限制的當(dāng)下,這種思路無疑展現(xiàn)出可觀的競爭力。
市場反應(yīng):
美國科技股估值回調(diào),
源于對算力霸權(quán)的質(zhì)疑
DeepSeek系列模型推出后,如同在市場上投下一枚“震撼彈”,直接導(dǎo)致以英偉達(dá)為代表的美國科技股出現(xiàn)大幅波動。相比之下,國內(nèi)AI產(chǎn)業(yè)界對DeepSeek訓(xùn)練成本低的消息并不感到意外。
一位頭部大模型公司技術(shù)負(fù)責(zé)人向中國城市報(bào)記者分析:“557.6萬美元只是單次訓(xùn)練純算力成本;如果要加上預(yù)實(shí)驗(yàn)、數(shù)據(jù)清洗等流程,實(shí)際成本肯定要翻倍。但無論如何,相比國外閉源大模型,它依舊保持了極強(qiáng)的成本控制力。而且隨著時(shí)間推移,后來者總比先驅(qū)更具成本優(yōu)勢,尤其在算法和數(shù)據(jù)管理上會更為成熟?!?
《大西洋月刊》CEO湯普森表示,中國的開源模型在使用相對較少數(shù)據(jù)進(jìn)行訓(xùn)練的情況下,也能產(chǎn)出與OpenAI或Claude相當(dāng)?shù)男Ч?,這對于減少能耗、提高效率具有重要意義。
事實(shí)上,國內(nèi)大模型創(chuàng)業(yè)公司普遍在算力、資金方面面臨嚴(yán)峻限制,因而更傾向在軟件、算法和工程優(yōu)化層面尋找突破。DeepSeek獨(dú)辟蹊徑,通過更高效的計(jì)算拓?fù)浜湍P徒Y(jié)構(gòu)設(shè)計(jì),在保持相近性能的情況下,把算力成本砍掉近60%。“別人用100元訓(xùn)練,DeepSeek用40元就能搞定,很多投資人一下子看到了大模型企業(yè)的新思路?!币晃粯I(yè)內(nèi)資深分析師評價(jià)道,“這不只是技術(shù)路線的博弈,更重要的是為打破硅谷——華爾街聯(lián)合主導(dǎo)的AI敘事,打開了一條新通道。”
DeepSeek的問世被外界比喻為神秘的東方力量?!霸跇O其有限的資源條件下,通過算法層面的精心設(shè)計(jì)反超對手,展現(xiàn)了中國工程師文化與成本意識的雙重優(yōu)勢。”該分析師同時(shí)指出,DeepSeek的成功為業(yè)界提供了一個(gè)關(guān)鍵啟示:在基礎(chǔ)硬件和數(shù)據(jù)資源都有限的前提下,如何通過算法和工程能力實(shí)現(xiàn)質(zhì)的飛躍,是未來AI大模型產(chǎn)業(yè)亟待解決的核心命題。
硅谷巨頭的技術(shù)路徑被挑戰(zhàn)
Meta內(nèi)部一位工程師在公司員工社區(qū)中直言:“DeepSeek極低的訓(xùn)練成本,讓管理層開始擔(dān)憂此前投入數(shù)百億美元進(jìn)行生成式AI研發(fā)的必要性?!碑?dāng)“燒錢堆算力”不再是唯一可行道路,新創(chuàng)企業(yè)與巨頭之間的鴻溝便不再涇渭分明。深層次來看,DeepSeek以“省錢省力”的方式取得媲美GPT-4o、o1的模型表現(xiàn),其背后是一場工程實(shí)用主義對技術(shù)理想主義的沖擊。
在OpenAI、甲骨文、英偉達(dá)等聯(lián)合宣布啟動高達(dá)5000億美元算力基建計(jì)劃的節(jié)骨眼上,DeepSeek卻用不到六成成本訓(xùn)練出同等規(guī)模和精度的大模型,不僅為“重資產(chǎn)”的美國AI生態(tài)敲響了警鐘,更令他們對硬件與資金堆積模式的前景產(chǎn)生疑慮。國內(nèi)一家大型科技公司的AI研究負(fù)責(zé)人接受采訪時(shí)表示:“當(dāng)工程優(yōu)化帶來的邊際收益遠(yuǎn)高于單純加芯片的線性增長,硅谷多年來賴以維系的技術(shù)優(yōu)勢就需要重新評估?!?
換言之,DeepSeek的出現(xiàn)也挑戰(zhàn)了美國AI巨頭在資本與市場層面的敘事框架。對于真正需要盈利和長期發(fā)展的企業(yè)而言,控制成本、提高效率、獲得更高社會接受度才是硬道理。
“我們當(dāng)然為這一突破感到自豪,但也要保持清醒。”該國內(nèi)大型科技公司負(fù)責(zé)人稱,“不是每一家企業(yè)都能像OpenAI或xAI一樣,一輪就融到幾十億美元。DeepSeek的路線具有極強(qiáng)的實(shí)用價(jià)值,對那些資金鏈并不充裕的AI企業(yè)而言,這無疑是一種更現(xiàn)實(shí)的突圍方式?!?
跨國科技企業(yè)爭相適配 搶灘DeepSeek生態(tài)
當(dāng)華爾街與硅谷仍在激辯DeepSeek的沖擊時(shí),國際科技巨頭們已率先行動,與DeepSeek-R1模型實(shí)現(xiàn)了快速對接。2月7日之前,英偉達(dá)、微軟、亞馬遜、華為云、騰訊云等行業(yè)領(lǐng)軍企業(yè)已密集推出了基于DeepSeek模型的產(chǎn)品或服務(wù),以期分食這一快速增長的用戶市場。
DeepSeek之所以在短時(shí)間內(nèi)獲得全球性擁抱,關(guān)鍵原因在于其模型全面開源,并兼容主流硬件與軟件平臺。全球各大云廠商與芯片廠商都希望藉由DeepSeek快速增長的人氣,擴(kuò)大自身生態(tài)體系的影響力。
天數(shù)智芯相關(guān)負(fù)責(zé)人向中國城市報(bào)記者表示,DeepSeek與國內(nèi)自主GPU適配的工作持續(xù)推進(jìn),不僅能實(shí)現(xiàn)更高效的深度學(xué)習(xí)框架融合,同時(shí)也能減少對國外硬件平臺的依賴?!斑@對國內(nèi)人工智能產(chǎn)業(yè)鏈的自主可控意義深遠(yuǎn)。未來隨著DeepSeek模型的進(jìn)一步升級,加之硬件與軟件的協(xié)同優(yōu)化,AI應(yīng)用落地的門檻將被大大降低?!?
在受訪專家看來,DeepSeek的熱度并非曇花一現(xiàn),而是背后蘊(yùn)含了“算法革命”與“應(yīng)用落地”的雙重價(jià)值。一方面,通過對模型結(jié)構(gòu)與訓(xùn)練流程的改進(jìn),DeepSeek在性能與成本之間找到了更優(yōu)解;另一方面,開源策略吸引全球開發(fā)者貢獻(xiàn)力量,形成“反哺”式生態(tài),進(jìn)一步推動算法演進(jìn)與商業(yè)化落地。