文心輕量化思考模型登頂HuggingFace全球熱度榜榜首
                            2025-09-11 18:07                              
                            來源: 云財經(jīng)                              
                            影響力評估指數(shù):24.2  
                        
                    相關股票:
                            
                            
                                    云財經(jīng)訊,據(jù)HuggingFace官網(wǎng)數(shù)據(jù),截至2025年9月11日,百度最新開源(300109)的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趨勢榜上排名第一,模型總榜排名第三。ERNIE-4.5-21B-A3B-Thinking 作為一款 21B 總參數(shù)量,激活僅 3B 的輕量級模型,在各項測試中的表現(xiàn)緊追業(yè)界頂級大尺寸模型,以輕量級規(guī)模實現(xiàn)了接近 SOTA 的智能表現(xiàn)。ERNIE-4.5-21B-A3B-Thinking 采用了混合專家(MoE) 架構,總參數(shù)規(guī)模達21B,每個 token 激活 3B參數(shù),通過指令微調及強化學習訓練。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基礎上訓練的深度思考模型,支持 128K 的上下文窗口,適用于需要長上下文的復雜推理任務。該模型不僅在邏輯推理、數(shù)學、科學,代碼與文本生成等需要人類專家的任務上實現(xiàn)了顯著提升,還具備高效的工具調用能力,能夠支持復雜任務的自動化處理。       
                                
                                | 新聞標題 | 時間 | 消息來源 | 新聞熱度 | 
|---|---|---|---|
| 10月31日:“農(nóng)產(chǎn)品批發(fā)價格200指數(shù)”比昨天上升0.38個點 | 10-31 14:48 | 云財經(jīng) |  | 
| 立訊精密:預計2025年凈利潤同比增長23.59%-28.59% | 10-30 20:07 | 云財經(jīng) |  | 
| 吉華集團起訴陸家嘴信托索賠逾6000萬元,涉案產(chǎn)品華鼎18號存多項違規(guī) | 10-30 10:46 | 云財經(jīng) |  | 
| A股三季報透視:社保與公募基金“同框”456只個股 | 10-30 07:02 | 云財經(jīng) |  | 
| 澳大利亞核電股追隨美國核電股上漲 | 10-29 07:43 | 云財經(jīng) |  | 
| 營收凈利雙增 國睿科技前三季度穩(wěn)健前行 | 10-28 10:38 | 商業(yè)新聞 |  | 
 
         
         
         
         
         
     
				