【CNMO科技消息】近日,DeepSeek R1模型迎來重要升級,最新版本DeepSeek-R1-0528正式發布。此次更新通過強化后訓練過程,顯著提升了模型的思維深度與推理能力,在多個領域展現出更優異的性能。
在深度思考能力方面,DeepSeek-R1-0528以2024年12月發布的DeepSeek V3 Base模型為基座,投入更多算力進行優化。這使得新模型在數學、編程和通用邏輯等多個基準測評中表現卓越,成績位居國內模型前列,并接近國際頂尖水平,如o3與Gemini-2.5-Pro。特別是在AIME 2025測試中,新版模型的準確率從舊版的70%提升至87.5%,顯示出在復雜推理任務中的顯著進步。這一提升得益于模型在解題過程中進行了更為詳盡和深入的思考,平均每題使用的tokens從12K增加到23K。
除了深度思考能力的提升,DeepSeek-R1-0528還在其他方面進行了優化。針對“幻覺”問題,新模型在改寫潤色、總結摘要、閱讀理解等場景中的幻覺率降低了45%~50%,提供了更為準確、可靠的結果。在創意寫作方面,新模型針對議論文、小說、散文等文體進行了優化,能夠輸出篇幅更長、結構更完整的長篇作品,且風格更貼近人類偏好。
此外,DeepSeek-R1-0528還支持工具調用功能,盡管不支持在thinking中進行工具調用,但在Tau-Bench測評中表現良好,與OpenAI o1-high相當。同時,新模型在前端代碼生成、角色扮演等領域的能力也有所提升。
API方面,DeepSeek-R1-0528已同步更新,接口與調用方式保持不變,但增加了Function Calling和JsonOutput的支持。官方還調整了max_tokens參數的含義,用于限制模型單次輸出的總長度,包括思考過程。