光棍影院手机在线观看,漂亮的保姆3在线看,农民工又大又粗的j吧,无碼亂倫凹凸av视頻

首頁 > 新聞中心 > 科技

DeepSeek官宣R1升級:提升思維深度與推理能力,整體表現(xiàn)已接近國際頂尖模型

來源: 澎湃新聞

2025-05-29 21:57:00

澎湃新聞記者 范佳來

國產(chǎn)大模型公司深度求索(DeepSeek)發(fā)布詳細的升級公告,解釋DeepSeek-R1升級的具體情況。

5月29日,據(jù)DeepSeek公告,DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。用戶通過官方網(wǎng)站、APP或小程序進入對話界面后,開啟“深度思考”功能即可體驗最新版本。API也已同步更新,調(diào)用方式不變。

公告指出,DeepSeek-R1-0528使用2024年12月所發(fā)布的DeepSeek V3 Base模型作為基座,但在后訓練過程中投入了更多算力,顯著提升模型的思維深度與推理能力。更新后的R1模型在數(shù)學、編程與通用邏輯等多個基準測評中取得當前國內(nèi)所有模型中首屈一指的優(yōu)異成績,并且在整體表現(xiàn)上已接近其他國際頂尖模型,如o3與Gemini-2.5-Pro。

相較于舊版R1,新版模型在復雜推理任務中的表現(xiàn)有顯著提升。例如在AIME2025測試中,新版模型準確率由舊版的70%提升至87.5%。這一進步得益于模型在推理過程中的思維深度增強:在AIME2025測試集上,舊版模型平均每題使用12K tokens,而新版模型平均每題使用23Ktokens,表明其在解題過程中進行了更為詳盡和深入的思考。

DeepSeek表示,DeepSeek-R1-0528的思維鏈對于學術(shù)界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義。

新版DeepSeek R1針對“幻覺”問題進行了優(yōu)化。與舊版相比,更新后的模型在改寫潤色、總結(jié)摘要、閱讀理解等場景中,幻覺率降低45-50%左右,能夠有效地提供更為準確、可靠的結(jié)果。

在舊版R1的基礎(chǔ)上,更新后的R1模型針對議論文、小說、散文等文體進行進一步優(yōu)化,能夠輸出篇幅更長、結(jié)構(gòu)內(nèi)容更完整的長篇作品,同時呈現(xiàn)出更加貼近人類偏好的寫作風格。

據(jù)公告稱,當前模型的測評成績與OpenAI o1-high相當,但與o3-High以及Claude4 Sonnet仍有差距。

此次 R1更新后,官方網(wǎng)站、小程序、App端和API中的模型上下文長度仍為64K。如果用戶對更長的上下文長度有需求,可以通過其他第三方平臺調(diào)用上下文長度為128K的開源版本R1-0528模型。與舊版本的DeepSeek-R1保持一致,此次升級仍為開源模型,允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

此前5月28日,DeepSeek在官方微信群發(fā)布消息稱,DeepSeekR1模型已完成“小版本試升級”,歡迎前往官方網(wǎng)頁、APP、小程序測試(打開深度思考),API接口和使用方式保持不變。

據(jù)網(wǎng)友測評顯示,此次升級效果令人驚艷。從社交媒體的反饋來看,網(wǎng)友最為關(guān)注的是此次DeepSeekR1更新后的思考時間變長。據(jù)測評顯示,此次DeepSeek單任務處理時長可達30-60分鐘。

主站蜘蛛池模板: 纳雍县| 南雄市| 乌鲁木齐县| 璧山县| 寿阳县| 焦作市| 霍林郭勒市| 铅山县| 宁陵县| 南岸区| 阳江市| 溆浦县| 县级市| 通海县| 云南省| 屏山县| 剑阁县| 凤山县| 巩义市| 尤溪县| 鄂伦春自治旗| 平阳县| 辽宁省| 八宿县| 田阳县| 奈曼旗| 于田县| 衡东县| 慈溪市| 漾濞| 平顶山市| 安溪县| 大理市| 高唐县| 南和县| 汶川县| 平山县| 田阳县| 津南区| 郸城县| 通道|