DeepSeek首次回應蒸餾OpenAI質疑
2025-09-18 13:01   
來源: 云財經   
影響力評估指數(shù):16.54  
云財經訊,9月18日,DeepSeek再次引發(fā)轟動。由DeepSeek團隊共同完成、梁文鋒擔任通訊作者的DeepSeek-R1研究論文,登上了國際權威期刊《Nature》的封面。 今年1月,DeepSeek曾在arxiv公布了初版預印本論文,相較而言,此次發(fā)布在《Nature》的版本補充了更多模型細節(jié),減少了描述中的擬人化說明。在補充材料中,DeepSeek提到了R1模型的訓練成本僅29.4萬美元,以及回應了模型發(fā)布之初關于蒸餾OpenAI的質疑。 今年1月,有報道提到,OpenAI研究人員認為,DeepSeek可能使用了OpenAI模型的輸出來訓練R1,這種方法可以在使用較少資源的情況下加速模型能力提升。 在論文的補充資料部分,DeepSeek回應了關于DeepSeek-V3-Base訓練數(shù)據(jù)來源的問題?!癉eepSeek-V3-Base的訓練數(shù)據(jù)僅來自普通網頁和電子書,不包含任何合成數(shù)據(jù)。在預訓練冷卻階段,我們沒有故意加入OpenAI生成的合成數(shù)據(jù),此階段使用的所有數(shù)據(jù)都是通過網頁抓取的。”DeepSeek表示。(一財)
云財經智能匹配相關概念
新聞標題 | 時間 | 消息來源 | 新聞熱度 |
---|---|---|---|
成都高投成立集成電路新公司 注冊資本8000萬 | 今天 15:15 | 云財經 |
|
不顧當?shù)胤磳?駐日美軍時隔25年重啟艦載機起降訓練 | 今天 14:17 | 云財經 |
|
福特汽車計劃在德國進一步裁員 | 今天 00:17 | 云財經 |
|
永福股份中標印尼220千伏輸變電EPC總承包項目 | 09-16 20:24 | 云財經 |
|
三花智控今日漲停,陳小群席位凈買入2.01億元 | 09-16 16:33 | 云財經 |
|
北摩高科與關聯(lián)方共同投資賽尼航空,放棄優(yōu)先認購權 | 09-15 21:13 | 云財經 |
|