系统极客一直在努力
专注操作系统及软件使用技能

Claude 3.5 Sonnet 免费发布:速度翻倍,性能更强

Claude 3.5 模型家族的首款力作——Claude 3.5 Sonnet 免费发布!这款新 AI 模型不仅在性能上超越了市场上的大多数竞争对手,甚至超越了之前的 Claude 3 Opus,同时还保持了与中端模型 Claude 3 Sonnet 相当的性价比。

现在,你就可以在 Claude.ai 网站和 Claude iOS 应用上免费体验 Claude 3.5 Sonnet!如果你是 Claude Pro 或 Team 计划的订阅用户,将可以享受到更高的使用频率。此外,你也可以通过 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 平台调用该模型,费用为每百万输入 Token 3 美元,每百万输出 Token 15 美元,最大支持 200K Token 的数据处理窗口。

每百万 Token 价格
每百万 Token 价格

Claude 3.5 Sonnet 智能更强,速度翻倍

Claude 3.5 Sonnet 不仅性能出色,速度更是翻了一番!在 GPQA(研究生级推理)、MMLU(本科生级知识)和 HumanEval(编程能力)等方面,它都树立了新的行业标准。此外,新模型在理解细微差异、幽默感和复杂指令方面也有显著提升,能够以更自然、更引人入胜的语气生成高质量内容。

相比 Claude 3 Opus, Claude 3.5 Sonnet 的运行速度提高了一倍。速度的提升,加上卓越的成本效益,让它成为处理复杂任务的理想选择。例如,在敏感环境中提供客户支持,以及管理多步骤工作流程等。

在一项内部编码能力评估中,Claude 3.5 Sonnet 成功解决了 64% 的问题,远超 Claude 3 Opus 的 38%。这项评估测试了模型根据自然语言描述来改进开源代码库的能力,包括修复 Bug 和添加新功能。在接受指导并使用相关工具后,Claude 3.5 Sonnet 能够独立完成代码编写、编辑和执行,并展现出了强大的推理和问题解决能力。此外,它还擅长于代码转换,特别适用于更新老旧应用程序和代码库迁移等场景。

Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 和 Llama-400b 推理能力对比
Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o、Gemini 1.5 Pro 和 Llama-400b 推理能力对比

视觉能力再升级

Claude 3.5 Sonnet 是 Anthropic 迄今为止最强大的视觉模型,在标准视觉测试中的表现超越了 Claude 3 Opus,尤其是在解析图表、图形等需要视觉推理的任务中表现尤为出色。

此外,它还能从低质量图片中准确识别文本,这对于零售、物流和金融服务等行业至关重要,因为这些行业获取信息的方式往往不仅限于文本分析,还需要从图像、图表或插图中提取洞察。

Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o 和 Gemini 1.5 Pro 视觉能力对比
Claude 3.5 Sonnet 与 Claude 3 Opus、GPT-4o 和 Gemini 1.5 Pro 视觉能力对比

Artifacts: Claude 的全新应用方式

Claude.ai 上的全新功能 Artifacts,为用户与 Claude 的交互带来了更多可能性。当你请求 Claude 生成代码片段、文档或网站设计等内容时,输出成果将在一个专门的窗口中清晰展示,与对话界面并排显示。这样一来,你就可以在一个动态的工作环境中实时查看、编辑和完善 Claude 的创意,轻松地将 AI 生成的内容融入自己的项目和工作流程中。

Artifacts 功能的推出标志着 Claude 正在从单纯的对话型 AI 向协作工作环境迈进。这只是 Claude.ai 更宏大愿景的一部分,未来还将支持团队协作。在不久的将来,团队甚至整个组织都将能够在一个安全的共享空间中整合他们的知识、文档和正在进行的工作,而 Claude 将作为一名随时待命的团队伙伴,来提供全方位的支持。

安全与隐私保护

Claude 3.5 Sonnet 模型经过严格的测试,以最大程度降低滥用风险。尽管它在智能方面取得了显著进步,但经过安全测试团队(红队)评估显示,它仍然符合 ASL-2 安全级别。更多详细信息,请查看模型卡片附录

为了确保安全和透明度,Anthropic 团队与外部专家紧密合作,对新模型的安全机制进行了全面测试和改进。最近,Claude 3.5 Sonnet 还提交给了英国人工智能安全研究所(UK AISI)进行部署前的安全评估,并根据最新的美英人工智能安全研究所合作备忘录分享了测试结果

Anthropic 团队还积极听取外部专家的反馈,以确保评估全面周到,并考虑到最新的滥用趋势。例如,采纳了来自 Thorn 的儿童安全专家的反馈,对分类器进行了更新,并对模型进行了微调。

在开发 AI 模型时,保护用户隐私是 Anthropic 的核心原则。除非明确获得用户授权,否则不会使用你提交的数据来训练生成模型。到目前为止,Anthropic 从未使用任何客户或用户提交的数据来训练模型。


Anthropic 的目标是在智能、速度和成本方面不断突破,并努力将迭代周期控制在几个月以内。为了完善 Claude 3.5 模型系列,Anthropic 还计划在今年晚些时候推出 Claude 3.5 Haiku 和 Claude 3.5 Opus,敬请期待!

赞(3) ¥ 赞赏
分享到

评论 抢沙发

微信赞赏