文心輕量化思考模型登頂HuggingFace全球熱度榜榜首
2025-09-11 18:07   
來源: 云財經(jīng)   
影響力評估指數(shù):24.2  
相關(guān)股票:
云財經(jīng)訊,據(jù)HuggingFace官網(wǎng)數(shù)據(jù),截至2025年9月11日,百度最新開源(300109)的文心思考模型ERNIE-4.5-21B-A3B-Thinking,在HuggingFace文本模型趨勢榜上排名第一,模型總榜排名第三。ERNIE-4.5-21B-A3B-Thinking 作為一款 21B 總參數(shù)量,激活僅 3B 的輕量級模型,在各項測試中的表現(xiàn)緊追業(yè)界頂級大尺寸模型,以輕量級規(guī)模實(shí)現(xiàn)了接近 SOTA 的智能表現(xiàn)。ERNIE-4.5-21B-A3B-Thinking 采用了混合專家(MoE) 架構(gòu),總參數(shù)規(guī)模達(dá)21B,每個 token 激活 3B參數(shù),通過指令微調(diào)及強(qiáng)化學(xué)習(xí)訓(xùn)練。ERNIE-4.5-21B-A3B-Thinking 是在 ERNIE-4.5-21B-A3B 基礎(chǔ)上訓(xùn)練的深度思考模型,支持 128K 的上下文窗口,適用于需要長上下文的復(fù)雜推理任務(wù)。該模型不僅在邏輯推理、數(shù)學(xué)、科學(xué),代碼與文本生成等需要人類專家的任務(wù)上實(shí)現(xiàn)了顯著提升,還具備高效的工具調(diào)用能力,能夠支持復(fù)雜任務(wù)的自動化處理。
新聞標(biāo)題 | 時間 | 消息來源 | 新聞熱度 |
---|---|---|---|
9部門:鼓勵引進(jìn)國外優(yōu)秀體育賽事 支持地方舉辦大眾體育賽事 | 今天 17:02 | 云財經(jīng) |
|
極兔速遞與戈20正式簽署戰(zhàn)略合作協(xié)議 | 09-15 16:52 | 云財經(jīng) |
|
固態(tài)電池商業(yè)化面臨成本挑戰(zhàn) 低空應(yīng)用有望率先破局 | 09-15 07:11 | 云財經(jīng) |
|
俄白聯(lián)合軍演繼續(xù) 俄戰(zhàn)機(jī)載彈飛行 | 09-14 07:58 | 云財經(jīng) |
|
胡錫進(jìn):給西貝和它的創(chuàng)始人賈國龍幾句忠告 | 09-13 17:58 | 云財經(jīng) |
|
清華大學(xué)教授歐陽明高:電力行業(yè)是目前改革最活躍,市場機(jī)遇最突出的領(lǐng)域之一 | 09-13 10:43 | 云財經(jīng) |
|