Primate Labs正式发布了Geekbench AI,这是一款专为机器学习和以人工智能为中心的工作负载而设计的基准测试工具。
Geekbench AI 1.0 的发布标志着多年来与客户、合作伙伴和人工智能工程社区的开发与合作达到了顶峰。该基准在预览阶段曾被称为 Geekbench ML,现已重新命名,以与行业术语保持一致,并确保其目的明确。
Geekbench AI现在可通过Primate Labs网站以及移动设备的谷歌Play商店和苹果App Store下载,适用于Windows、macOS和Linux。
Primate Labs 的最新基准测试工具旨在提供一种标准化方法,用于衡量和比较不同平台和架构的人工智能能力。该基准提供了一种独特的方法,即提供三个总分,以反映人工智能工作负载的复杂性和异质性。
“Primate Labs 解释说:"简单地说,衡量性能真的很难。“这并不是因为运行任意测试很难,而是因为很难确定哪些测试对你想要衡量的性能最重要--尤其是在不同的平台上,尤其是当每个人都在以微妙不同的方式做事时。”
三评分系统考虑到了现代人工智能实现中的不同精度水平和硬件优化。这种多维方法允许开发人员、硬件供应商和爱好者更深入地了解设备在不同场景下的人工智能性能。
Geekbench AI 的一个显著新增功能是为每个测试加入了准确度测量。这一功能表明,人工智能的性能不仅与速度有关,还与结果的质量有关。通过将速度和准确性指标相结合,Geekbench AI 提供了更全面的人工智能能力视图,帮助用户了解性能和准确性之间的权衡。
Geekbench AI 1.0引入了对各种人工智能框架的支持,包括Linux和Windows上的OpenVINO,以及供应商特定的TensorFlow Lite代表,如Android上的三星ENN、ArmNN和高通QNN。这种广泛的框架支持确保该基准能够反映人工智能开发人员使用的最新工具和方法。
该基准还采用了更广泛、更多样的数据集,不仅提高了评估的准确性,而且更好地代表了真实世界的人工智能使用案例。Geekbench AI 1.0 中的所有工作负载都至少运行一秒钟,使设备在测试过程中达到最高性能水平,同时还能反映真实世界应用的突发特性。
Primate Labs 公布了 Geekbench AI 1.0 中使用的工作负载和模型的详细技术说明,强调了他们对透明度和行业标准测试方法的承诺。该基准与 Geekbench 浏览器集成,便于进行跨平台比较和结果共享。
该公司预计将定期更新 Geekbench AI,以跟上市场变化和新兴人工智能功能的步伐。不过,Primate Labs 认为,Geekbench AI 的可靠性已经达到了适合集成到专业工作流程中的水平,三星和 Nvidia 等大型科技公司已经在使用该基准。
上一条: 生成式人工智能是云投资的首要驱动力