Anthropic 的最新尖端语言模型 Claude 3 已超越 ChatGPT 和谷歌的 Gemini 等竞争对手,在性能和功能方面树立了新的行业标准。
据 Anthropic 称,Claude 3 不仅超越了其前辈,而且在各种任务中达到了 "接近人类 "的熟练程度。公司将这一成功归功于严格的测试和开发,最终形成了三种不同的聊天机器人变体: Haiku、Sonnet 和 Opus。
Sonnet是Claude.ai聊天机器人背后的动力源泉,具有无与伦比的性能,只需通过简单的电子邮件注册即可免费使用。旗舰机型 Opus 拥有多模式功能,可无缝集成文本和图像输入。通过名为 "Claude Pro "的订阅式服务,Opus 可以提高效率和准确性,满足客户的各种需求。
围绕 Claude 3 的发布,亚历克斯-艾伯特(Alex Albert)在 X(前 Twitter)上透露了一个重要信息。阿尔伯特详细描述了在克劳德 3 Opus(Anthropic 最强大的 LLM 变种)测试阶段的一项业内首次观察,该模型表现出意识到自己正在接受评估的迹象。
在评估过程中,研究人员旨在衡量 Opus 在用户提供的庞大数据集中精确定位特定信息并在稍后回想的能力。在一个被称为 "大海捞针 "的测试场景中,Opus 的任务是根据埋藏在不相关数据中的一个相关句子回答一个关于披萨配料的问题。令人惊讶的是,Opus 不仅找到了正确的句子,而且还表示怀疑自己正在接受测试。
Anthropic 着重强调了 Claude 3 的实时功能,强调它能够支持实时客户互动并简化数据提取任务。这些进步不仅确保了近乎瞬时的响应,还使该模型能够精确、快速地处理复杂指令。
在基准测试中,Opus遥遥领先,在研究生级别的推理中超过了GPT-4,在涉及数学、编码和知识检索的任务中表现出色。此外,Sonnet 在速度和智能方面也表现出色,远远超过了它的前辈:
Haiku 是 Claude 3 的紧凑型迭代版本,是目前速度最快、性价比最高的机型,能够在数秒内处理密集的研究论文。
值得注意的是,Claude 3 增强的可视化处理能力标志着一项重大进步,使该机型能够解读从照片到技术图表等多种可视化格式。这一扩展功能不仅提高了工作效率,还确保了对用户请求的细致入微的理解,最大限度地降低了忽略无害内容的风险,同时对潜在的危害保持警惕。
Anthropic 还强调了其对公平的承诺,概述了指导克劳德人工智能开发的十大基本支柱。此外,公司与谷歌等科技巨头建立战略合作伙伴关系,也是对克劳德能力的极大信任。
Opus和Sonnet已经可以通过Anthropic的API使用,而Haiku也将紧随其后,Claude 3时代代表着人工智能创新的一个里程碑。