智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開源SOTA模型

2025-07-29 09:41 來源：證券日報網(wǎng)

本報訊（記者梁傲男）7月28日，北京智譜華章科技股份有限公司（以下簡稱“智譜”）發(fā)布新一代旗艦模型GLM-4.5，專為智能體應用打造的基礎模型。Hugging Face與ModelScope平臺同步開源，模型權重遵循MIT License。

據(jù)悉，GLM-4.5在包含推理、代碼、智能體的綜合能力達到開源SOTA，在真實代碼智能體的人工對比評測中，實測國內最佳。

智譜方面有關人士表示，衡量AGI的第一性原理，是在不損失原有能力的前提下融合更多通用智能能力，GLM-4.5是智譜對此理念的首次完整呈現(xiàn)，并有幸取得技術突破。GLM-4.5首次在單個模型中實現(xiàn)將推理、編碼和智能體能力原生融合，以滿足智能體應用的復雜需求。

智譜/供圖

記者了解到，為綜合衡量模型的通用能力，智譜選擇了最具有代表性的12個評測基準，綜合平均分，GLM-4.5取得了全球模型第三、國產(chǎn)模型第一，開源模型第一。

在參數(shù)效率方面，GLM-4.5參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3，但在多項標準基準測試中表現(xiàn)得更為出色，這得益于GLM模型的更高參數(shù)效率。在衡量模型代碼能力的SWE-benchVerified榜單上，GLM-4.5系列位于性能/參數(shù)比帕累托前沿，表明在相同規(guī)模GLM-4.5系列實現(xiàn)了最佳性能。

在性能優(yōu)化之外，GLM-4.5系列也在成本和效率上實現(xiàn)突破，由此帶來遠低于主流模型定價：API調用價格低至輸入0.8元/百萬tokens，輸出2元/百萬tokens。同時，高速版本實測生成速度最高可至100 tokens/秒，支持低延遲、高并發(fā)的實際部署需求，兼顧成本效益與交互體驗。

真實場景表現(xiàn)比榜單更重要。為評測GLM-4.5在真實場景Agent Coding中的效果，智譜接入Claude Code與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進行對比測試。測試采用52個編程開發(fā)任務，涵蓋六大開發(fā)領域，在獨立容器環(huán)境中進行多輪交互測試。實測結果顯示（如下圖），GLM-4.5相對其他開源模型展現(xiàn)出競爭優(yōu)勢，特別在工具調用可靠性和任務完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間，在大部分場景中可以實現(xiàn)平替的效果。

（編輯張明富）

-證券日報網(wǎng)

熱點新聞

多部大IP電影上映在即全年票房有望沖擊500億元

10月份中國中小企業(yè)發(fā)展指數(shù)為89.0 保持穩(wěn)中有進發(fā)展態(tài)勢

第八屆進博會收官意向成交額834.9億美元

海外主權基金持續(xù)深化對華合作加倉中國資產(chǎn)正當時

24小時排行一周排行

深度策劃

衛(wèi)星通信萬億賽道起飛，手機直連時代開啟

衛(wèi)星通信管理制度及政策法規(guī)進一步完善……[詳情]

市場快訊

23:59	金屬空氣電池賽道熱度攀升
23:59	凌志軟件擬收購凱美瑞德100%股權
23:59	遼港股份：做精港口主業(yè) 推動創(chuàng)新...
23:59	A股公司積極布局源網(wǎng)荷儲一體化項...
23:59	深入洞察家庭資產(chǎn)配置需求太平人...
23:59	方直科技擬以1.16億元收購執(zhí)象科技
23:59	存儲產(chǎn)業(yè)鏈上下游迎“超級周期”
23:59	我國6G專利申請量全球第一上市公...
23:59	多部大IP電影上映在即全年票房有...
23:59	上市公司競逐商業(yè)航天賽道
23:59	機器人加速進社區(qū) 物管行業(yè)探索“...
23:59	10月份標品信托成立規(guī)模環(huán)比增長12...

性爱av在线免费|成人主播免费国产|亚洲中文字幕自拍|亚洲成人社区免费|东京三区二区香蕉在线观看|久草 一区 日韩|日日日av日日日|天天干天天操人人操|亚洲精品中字无码国产原创剧传媒|亚洲春色AV无码专区在线播放

智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開源SOTA模型

性爱av在线免费|成人主播免费国产|亚洲中文字幕自拍|亚洲成人社区免费|东京三区二区香蕉在线观看|久草一区日韩|日日日av日日日|天天干天天操人人操|亚洲精品中字无码国产原创剧传媒|亚洲春色AV无码专区在线播放