新闻资讯

开yun体育网它在性能与效用之间竣事了更好的均衡-开云(中国)Kaiyun·体育官方网站 登录入口

发布日期:2026-06-04 12:04    点击次数:57

Claude 4 全新发布

转译自anthropic 官方:

今天,咱们发扬发布下一代Claude模子:Claude Opus 4 和 Claude Sonnet 4,在编程才气、高档推理和AI智能体方面缔造了全新标杆。

Claude Opus 4 是刻下寰球最强的编程模子,能永劫分踏实处理复杂任务和智能体使命流;而 Claude Sonnet 4 在上一代基础上大幅进步,编程和推理才气更强,指示实行愈加精确。

本次还推出了一些垂危更新:

膨胀想维器具(测试版):两款新模子均能在膨胀想考历程中使用器具(如采集搜索),轮流进行推理与器具调用,握续优化谜底质料。

新功能升级:新模子搭救并诳骗用多个器具,实行指示愈加精确;建立者提供土产货文献探望权限后,模子能显赫进步挂牵力,索乞降保存关键信息,以遥远保握连贯性并积聚隐性学问。

Claude Code 发扬上线:广受好评的Claude Code咫尺全面灵通。它可通过GitHub Actions实行后台任务,并与VS Code、JetBrains无缝集成,在裁剪器中径直呈当代码修改,助力流通的和谐式编程体验。

张开剩余80%

全新API才气:Anthropic API 新增四项功能,包括代码实行器具、MCP无间器、文献API,以及教导缓存功能(缓存时分长达1小时),匡助建立者构建更广大的AI智能体。

Claude Opus 4 和 Sonnet 4均提供两种使命风物:即时反映风物和膨胀想考风物。Claude Pro、Max、Team 和 Enterprise套餐用户可享用沿途功能,免用度户也能体验Sonnet 4的广大。两种模子均已通过Anthropic API、Amazon Bedrock 和 Google Cloud的Vertex AI平台上线,订价保握不变:Opus 4为每百万tokens输入15好意思元/输出75好意思元,Sonnet 4为每百万tokens输入3好意思元/输出15好意思元。

Claude 4 新模子亮点

Claude Opus 4 是迄今为止Claude最广大的模子,凭借在 SWE-bench(72.5%)和 Terminal-bench(43.2%)基准测试中的杰出确认,成为寰宇顶级编程模子。它能一语气数小时实行需要洪水横流个设施的复杂任务,远超所有这个词Sonnet系列模子,极大进步AI智能体的才气上限。

Opus 4 在编码和复杂问题处分方面的上风,使得前沿智能体家具赢得了极大进步:

Cursor 称其编程才气处于业界起始地位,大幅进步对复杂代码库的知晓。

Replit 赞叹其在跨文献复杂变更中的精确性和显赫高出。

Block 强调它初次在裁剪和调试历程中同期进步代码质料与踏实性。

Rakuten 使用Opus 4独处进行了长达7小时的高难度开源重构任务,确认踏实杰出。

Cognition 暗示Opus 4 能处分其它模子无法处理的复杂任务,关键四肢确认出色。

Claude Sonnet 4 在Sonnet 3.7基础上进一步提高,以72.7%的 SWE-bench 基准测试收获相通处于业界起始水平。它在性能与效用之间竣事了更好的均衡,并增强了对任务的精确甩掉。尽管在大部分规模略逊于Opus 4,但Sonnet 4 愈加相宜日常和泛泛的应用场景。

各行业反馈如下:

GitHub 以为Sonnet 4 在智能体场景确认罕见,并将用作新一代GitHub Copilot编程助手的基础模子。

Manus 细目其知晓复杂指示才气大幅进步,推理光显度更高,输出效果更好意思不雅。

iGent 强调其多功能APP建立方面确认优异,极大减少代码导航中的失误率。

Sourcegraph 暗示Sonnet 4在软件建立中的问题知晓更长远,代码质料更优雅。

Augment Code 赞誉Sonnet 4 在复杂任务中确认更严慎、裁剪愈加精确、得胜率更高,成为他们的首选模子。

这些高出鼓吹用户AI计谋的全面升级:Opus 4 膨胀了编码、盘考、写稿与科学探索的极限;Sonnet 4则提供了日常应用场景的显赫升级。

Claude 4在 SWE-bench 基准测试中排行起始,竣工法子见附录。

Claude 4在编程、推理、多模态和智能体任务中均展现出罕见性能,竣工法子见附录。模子进一步优化除了上述才气,两款新模子显赫减少了“走捷径”或“钻随意”的行为,在智能体任务上,这种负面行为比Sonnet 3.7减少了65%。

Opus 4 在挂牵功能方面确认杰出。当允许探望土产货文献时,它概况主动创建“挂牵文献”,遥远存储关键信息,进步任求实行的连贯性和踏实性,举例在玩宝可梦游戏时自动创建导航指南。

以上是真确由Opus 4在玩游戏历程中创建的导航条记。

此外,咱们引入了“想维节录”功能,仅在少许数情况下(约5%)使用袖珍模子压缩较长的想维历程,以便捷用户稽查。需要原始精细推理历程的用户,可相关销售部门开启建立者风物。

立即体验Claude 4

Claude 4带来广大的假造和谐者体验:挂牵竣工高下文,握续专注于更长名目,鼓吹变革性终结。咱们已进行了全面安全测试和风险甩掉,包括AI安全等第ASL-3。

速即通过Claude官网、Claude Code或你喜欢的建立平台,驱动探索Claude 4带来的无尽可能吧

发布于:北京市






    Powered by 开云(中国)Kaiyun·体育官方网站 登录入口 @2013-2022 RSS地图 HTML地图

    Copyright Powered by站群 © 2013-2024