基于阿里最新開源的Qwen3-32B模型,DeepSWE開源AI Agent登頂榜首
2025-07-03 06:56   
來源: 云財(cái)經(jīng)   
影響力評估指數(shù):20.38  
相關(guān)股票:
云財(cái)經(jīng)訊,大模型訓(xùn)練平臺(tái)Together.ai聯(lián)合Agentica開源了創(chuàng)新AI Agent框架DeepSWE。DeepSWE是基于阿里最新開源(300109)的Qwen3-32B模型之上,完全使用強(qiáng)化學(xué)習(xí)訓(xùn)練而成。根據(jù)SWE-Bench-Verified測試數(shù)據(jù)顯示,DeepSWE在64k最大上下文長度和100最大環(huán)境步驟下進(jìn)行評估,最終在16次運(yùn)行平均的Pass@1準(zhǔn)確率上達(dá)到了42.2%,使用混合測試時(shí)擴(kuò)展(TTS)后性能進(jìn)一步提升至59%,超過了所有開源Agent框架位列榜首。DeepSWE證明了僅使用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練的有效性和巨大潛力。與其他開源模型相比,DeepSWE-Preview在不依賴于更強(qiáng)專有教師模型的蒸餾或SFT的情況下,依然能夠取得了最好的性能。
云財(cái)經(jīng)智能匹配相關(guān)概念
新聞標(biāo)題 | 時(shí)間 | 消息來源 | 新聞熱度 |
---|---|---|---|
航行警告 北部灣軍事訓(xùn)練 | 09-15 21:13 | 云財(cái)經(jīng) |
|
英鎊觸及兩個(gè)月高點(diǎn) 倫敦市場開盤后美元遭賣出 | 09-15 16:52 | 云財(cái)經(jīng) |
|
國內(nèi)金店零售價(jià)格呈現(xiàn)分化特征:周大福、周生生等主流品牌維持1078元/克的統(tǒng)一報(bào)價(jià) | 09-14 08:27 | 云財(cái)經(jīng) |
|
全國人大常委會(huì)預(yù)算工委何成軍:“十五五”時(shí)期消費(fèi)需求擴(kuò)張將來自商品消費(fèi)提質(zhì)升級和服務(wù)消費(fèi)快速增長 | 09-13 10:14 | 云財(cái)經(jīng) |
|
美國柯克槍擊案嫌疑人預(yù)計(jì)9月16日首次出庭 | 09-13 04:25 | 云財(cái)經(jīng) |
|
西藏旅游:持股5%以上股東旅投集團(tuán)減持0.31% | 09-12 18:16 | 云財(cái)經(jīng) |
|