首页 AI资讯 Anthropic发布“模拟计算机访问”及全新 Claude 3.5 Sonnet 和 Haiku

Anthropic发布“模拟计算机访问”及全新 Claude 3.5 Sonnet 和 Haiku

作者: AI反应堆 更新时间:2024-11-06 09:36:02 分类:AI资讯

6386529521593501491403444

10月22日,Anthropic 再次引爆了我们的期待,Claude 3.5 Sonnet 和 Claude 3.5 Haiku 的发布,让人们看到 AI 编程的未来正以超乎预期的速度到来。

这两款模型不仅在编程能力上大幅提升,还通过一个令人激动的新功能——“模拟计算机访问”,让我们真正看到了 AI 模型模拟人类操作电脑的无限可能。

1. “模拟计算机访问”

如果说 Claude 3.5 系列有什么真正让人耳目一新的功能,那一定是“模拟计算机访问”。通过这个功能,Claude 不再只是一个静态的工具,而是能够像人类一样操作电脑。是的,你没有听错!Claude 可以打开文件、点击按钮、输入文本,甚至执行复杂的多步骤任务。

开发人员可以通过 API控制 Claude指示 Claude 自动填写表格、浏览网页,甚至完成软件测试等繁琐的任务。

虽然这项技术还在不断完善中,但其潜力已经让人无比期待。在 OSWorld 测试中,Claude 在依靠截图操作的任务中得分达到 14.9%,领先于其他 AI 系统。

目前已在Claude 3.5 Sonnet公测版中提供该功能。

6386529531370507003830264

2. Claude 3.5 Sonnet

Claude 3.5 Sonnet 是 Anthropic 目前最为强大的编程 AI,Sonnet 在编码任务中的表现十分亮眼,尤其是在 SWE-bench 测试中,它的得分从 33.4% 一跃提升至 49.0%,超越了所有同类 AI 模型。

对于那些日常需要频繁处理复杂编码任务的开发者来说,Sonnet 如同一双“加速的翅膀”。从 DevOps 的自动化操作到开发环境中的安全监控,Sonnet 都展现出了卓越的处理能力。

3. Claude 3.5 Haiku

如果你正在寻找性价比高,同时又不牺牲速度的 AI 模型,那么 Claude 3.5 Haiku 绝对是你的不二选择。Haiku 保持了上一代的低延迟和高效能,但在性能上实现了质的飞跃。

在 SWE-bench 测试中,Haiku 的得分达到了 40.6%,超过了许多高级模型,包括Claude 3.5 Sonnet 和 GPT-4o。

对于那些需要快速处理大量数据的企业,Haiku 是一款理想的 AI 模型。能够应对比如电商平台上的个性化推荐,库存管理中的数据处理等场景。

升级版的 Claude 3.5 Sonnet 现已全面开放,所有用户均可使用。从今天起,开发者可以通过 Anthropic APIAmazon Bedrock 和 Google Cloud Vertex AI 访问和测试“模拟计算机访问”。而 Claude 3.5 Haiku 的发布定于本月晚些时候,敬请期待

相关文章