2月21日-23日在上海舉行的2025GDC全球開發者先鋒大會上,中國公司深度求索(DeepSeek)旗下生成式AI產品DeepSeek成為當之無愧的熱點話題,幾乎每個參會的觀眾、開發者都在談論DeepSeek。
為什么會是DeepSeek成功破圈、DeepSeek是否會成為中國的“OpenAI”?DeepSeek給現場的開發者們帶來哪些思考?澎湃科技記者在大會期間和AI從業者們聊了聊。
“DeepSeek給我帶來的最大的思考是它帶來了技術平權。”蜜度科技股份有限公司CTO劉益東告訴澎湃科技(www.thepaper.cn),DeepSeek幫助開發者和中小型大模型創業公司完成了AI市場教育。
“以前我們主動教育客戶,大模型能做什么,但DeepSeek出現后,客戶會主動提需求,我買你的大模型應用,但你最好能給我部署接入DeepSeek。”劉益東稱,這是現象級的變化。
DeepSeek是否能成為中國的“OpenAI”這一問題,在劉益東看來,應該換個角度討論。
與其討論DeepSeek能否成為中國版的“OpenAI”,不如說DeepSeek其實挑戰了OpenAI的模式,“DeepSeek也沒有必要成為中國版的OpenAI,成為OpenAI也并不是大模型的終局。”
OpenAI和馬斯克的xAI在大模型的投入上都是“大力出奇跡”,通過不停地堆算力來訓練大模型推理能力,但“DeepSeek用有限的資源走了一條適合國內的路,同樣呈現的效果也非常好。”劉益東說。
藍耘科技集團股份有限公司(以下簡稱“藍耘科技”)總監顧瑞泉認為,通過DeepSeek看到未來大模型發展的三個趨勢:首先,在專有或推理模型領域,越來越多的模型會開始降低預訓練和推理成本;其次,開源技術正在改變以前的行業思維,例如百度近期開源了一些模型,其他尚未開源的企業也在逐步開放技術。開源技術將對AI未來的發展做出重要貢獻。最后,人們不再專注于大模型預訓練,而是將焦點轉向后訓練階段,這將推動后續AI產業鏈上的創新。
藍耘科技CTO安江華認為,國內確實很難出現像OpenAI和xAI這樣的公司,“大力出奇跡”的路徑在國內行不通。
安江華分析認為,目前全球僅有少數幾家公司如OpenAI、馬斯克的xAI處于AI第一梯隊,DeepSeek在全球的位置仍屬于第二梯隊。第二梯隊的公司在財力上無法與第一梯隊相比,如果直接跟隨第一梯隊的策略,“大力出奇跡”,可能長期看下來會被拖垮。
從技術路徑來看,DeepSeek最大的優勢在于,通過算法優化和資源調配,減少了大語言模型(LLM)預訓練的時間,但實際上,還是利用了更多的人工時間來換取訓練效率的提升。“這種方式雖然節省了資金,但整體時間成本仍然很高。”安江華說。
安江華認為,在中國,單純依靠“大力出奇跡”的模式依然是行不通的。主要原因在于國內企業難以獲得足夠的資源支持大規模投入,,要實現類似規模OpenAI、xAI的發展,需要從一級和二級市場募集大量資金,但在國內面臨諸多限制。
是否還有其他可行的路徑?
安江華稱,DeepSeek有其先天優勢,它脫胎于幻方量化,這類通過量化起家的公司早期已經有相當充足的資金積累,選擇通過人工優化來換取訓練時間的縮短。未來可能會有越來越多的團隊選擇DeepSeek這類模式。當然,如果資金充足的情況下,“大力出奇跡”的模式當然是最佳選擇,但這并不是所有企業都能實現。返回搜狐,查看更多
相關標簽: