摘要
谷歌推出了一款名为Gemini 2.0 Flash Thinking的实验性人工智能模型,该模型基于 Gemini 2.0 Flash 平台构建,专注于提高推理能力。该模型旨在“大声思考”,在解决复杂问题时展示其思维过程,这一特点使其有别于其他人工智能系统。此新模型可在 Google AI Studio 和 Gemini API 中使用。
Gemini 2.0 闪电思维模型由谷歌 AI Studio 产品负责人 Logan Kilpatrick 发布,并得到谷歌 DeepMind 首席科学家 Jeff Dean 等重要人物的大力推崇,被誉为谷歌迈向打造具有高级推理能力的 AI 模型的第一步。
新功能:闪电思考模式
Gemini 2.0 Flash Thinking 的突出特点是能够明确展示其推理过程,即“思考模式”。这让用户可以查看人工智能如何将问题分解为更小的步骤,然后得出解决方案。该模型在处理涉及多模式输入的复杂任务(例如结合文本和视觉数据)方面特别有效,并且在数学、物理和创造性解决问题等领域表现出色。
用户可以通过在 Google AI Studio 中选择Gemini 2.0 Flash Thinking Experimental模型或通过 Gemini API 指定适当的模型代码 ( gemini-2.0-flash-thinking-exp
) 来访问此功能。思考过程将作为输出的一部分返回,使用户能够跟踪模型的推理。
主要功能
- 推理和解决问题:该模型在需要逻辑推理的任务中表现出色,并可以逐步解释其思维过程。
- 多模式理解:支持文本、图像、音频和视频等输入,输出包括文本和语音。
- 增强的性能:它提供更快的响应时间,同时保持与大型型号相当的高质量输出。
- 工具集成:该模型可以本地调用 Google 搜索等工具或执行代码。
性能指标
The leap from Gemini-2.0-Flash:
- – Overall: #3 → #1
- – Overall (Style Control): #4 → #1
- – Math: #2 → #1
- – Creative Writing: #2 → #1
- – Hard Prompts: #1 → #1 (+14 pts)
- – Vision: #1 → #1 (+16 pts)
Gemini-2.0-Flash-Thinking 在所有类别中均排名第一!
数学竞技场显著进步
Gemini-2.0-Flash-Thinking 在 Vision Arena 中也排名第一!
总体胜率热图
公司背景
Google DeepMind 一直致力于开发“代理”人工智能模型,即能够理解周围环境、提前规划多个步骤并在用户监督下执行任务的系统。Gemini 2.0 Flash Thinking 代表了这一方向的一个重要里程碑,它将速度与增强的推理能力相结合。
Gemini 2.0 Flash Thinking 目的
此功能解决了许多人工智能系统的一个关键限制:无法透明地解释其推理。通过使其思维过程可见,Gemini 2.0 Flash Thinking 不仅可以提高信任度,还可以让用户识别其逻辑中的潜在错误或偏见。这使得它特别适用于需要精确性和可追溯性的应用程序。
Gemini 2.0 Flash Thinking使用地址
Gemini 2.0 Flash Thinking 的实验版本目前已在Google AI Studio中推出,并通过 Gemini API 供开发人员和测试人员使用。预计将于明年初全面上市。
总而言之,谷歌 Gemini 2.0 闪电思维将解决问题的速度与透明度相结合,为人工智能推理引入了新范式。这标志着在创建更可靠、更强大的复杂任务人工智能系统方面迈出了重要一步。