12月20日,谷歌正式推出了实验性推理大模型Gemini 2.0 Flash Thinking。这款模型以其卓越的推理能力而闻名,其水平与物理、化学和生物学博士生相当,被视作OpenAI o1系列的有力竞争对手。
发布后,谷歌CEO Sundar Pichai在社交网络上对该模型赞誉有加,称其为“我们迄今为止最周到的模型”。
为了与OpenAI的o1竞争,谷歌DeepMind首席科学家Jeff Dean表示,该模型“经过训练,可以使用思维来加强其推理能力”,同时还受益于速度更快的Gemini Flash 2.0模型。
据悉,Gemini 2.0 Flash Thinking现已在Google AI Studio和Vertex AI中推出。它在Chatbot Arena LLM排行榜上首次亮相,位居“所有类别第一”。就在昨天,谷歌在Gemini应用程序中推出了2.0 Experimental Advanced,Gemini-Exp-1206也位居排行榜榜首。
与OpenAI的o1系列相比,Gemini 2.0 Flash Thinking在推理过程的透明度和可视化方面有着显著优势。用户可以通过下拉菜单访问其逐步推理过程,从而更清晰、更透明地了解模型如何得出结论。
除了卓越的推理能力和透明度外,Gemini 2.0 Flash Thinking还支持多模式理解、推理和编码等功能。它能够处理多种数据类型,包括文本、图像等,并能够在这些数据类型之间进行跨格式集成和推理。
然而,目前Gemini 2.0 Flash Thinking仍存在一些限制。它仅支持32000个标记输入(约50-60页文本),每个输出响应产生8000个标记。此外,该模型目前还不支持与谷歌搜索落地,也不支持与其他谷歌应用和外部第三方工具集成。
随着人工智能领域的竞争日趋激烈,Gemini 2.0 Flash Thinking可能标志着问题解决模型新时代的开始。