资讯公告
  • 你的位置:
  • 首页
  • >
  • 资讯公告
  • >
  • 人工智能
  • >
  • 谷歌在Gemini 2.5 Flash中引入人工智能推理控制功能
谷歌在Gemini 2.5 Flash中引入人工智能推理控制功能
发布时间:2025-04-24 发布者:FebHost

谷歌在Gemini 2.5 Flash中引入人工智能推理控制功能


谷歌为其 Gemini 2.5 Flash 模型推出了一种人工智能推理控制机制,允许开发人员限制系统在解决问题时的处理能力。


这项 “思维预算 ”功能于 4 月 17 日发布,以应对日益严峻的行业挑战:先进的人工智能模型经常过度分析简单的查询,从而消耗不必要的计算资源,推高运营和环境成本。


虽然这并不是一项革命性的创新,但它代表了在解决效率问题方面迈出的切实可行的一步,而随着推理能力成为商业人工智能软件的标准配置,效率问题也逐渐显现出来。


新机制能够在生成响应之前精确校准处理资源,从而有可能改变组织管理人工智能部署对财务和环境影响的方式。


“Gemini公司产品管理总监Tulsee Doshi承认:"模型想得太多了。“对于简单的提示,模型的思考确实超过了它的需要。”


这一承认揭示了高级推理模型所面临的挑战--这就好比用工业机械去敲核桃。


向推理能力的转变产生了意想不到的后果。传统的大型语言模型主要是匹配训练数据中的模式,而新的迭代模型则试图从逻辑上逐步解决问题。虽然这种方法能为复杂任务带来更好的结果,但在处理较简单的查询时,效率却大大降低。


平衡成本与性能


不加控制的人工智能推理会产生巨大的财务影响。根据谷歌的技术文档,当完全推理被激活时,生成输出结果的成本大约是标准处理的六倍。成本乘数为微调控制提供了强大的动力。


Hugging Face 公司研究推理模型的工程师内森-哈比卜(Nathan Habib)认为,这个问题是整个行业的通病。“他向《麻省理工科技评论》解释说:"在急于炫耀更智能的人工智能时,公司正像锤子一样伸向推理模型,甚至在看不到钉子的地方也是如此。


这种浪费不仅仅是理论上的。哈比卜演示了一个领先的推理模型在试图解决一个有机化学问题时,是如何陷入递归循环,重复 “等等,但是...... ”数百次的--本质上是经历了计算崩溃,消耗了处理资源。


DeepMind 负责评估 Gemini 模型的凯特-奥尔谢夫斯卡(Kate Olszewska)证实,谷歌的系统有时也会遇到类似问题,陷入循环,消耗计算能力,却无法提高响应质量。


细粒度控制机制


谷歌的人工智能推理控制为开发人员提供了一定程度的精确性。该系统提供了一个灵活的范围,从零(最小推理)到 24,576 代币的 “思考预算”--代表模型内部处理的计算单位。这种粒度方法允许根据特定用例进行定制部署。


DeepMind 首席研究科学家杰克-雷(Jack Rae)表示,定义最佳推理水平仍然具有挑战性: “真的很难划定一个界限,比如,现在什么是最适合思考的任务。”


发展理念的转变


人工智能推理控制的引入可能预示着人工智能发展方式的改变。自 2019 年以来,各家公司一直在通过建立具有更多参数和训练数据的大型模型来追求改进。谷歌的做法提出了另一条道路,即注重效率而非规模。


哈比卜说:“规模法则正在被取代。”他表示,未来的进步可能来自优化推理过程,而不是不断扩大模型规模。


环境影响同样重要。随着推理模型的增多,其能耗也会成正比增长。研究表明,推理--生成人工智能响应--现在比初始训练过程对技术碳足迹的贡献更大。谷歌的推理控制机制为这一令人担忧的趋势提供了潜在的缓解因素。

购物车