想得更仔细！Gemini 2.0 Flash Thinking 大型语言模型登场

2024 年 12 月 20 日

与 MBTI 人格测试的概念有点相似。尽可能贴近人类语言并且持续学习的大型语言模型技术，渐渐的也发展出了不同特性。继续阅读想得更仔细！Gemini 2.0 Flash Thinking 大型语言模型登场报导内文。
▲本篇图片来源：Google

相对於心直口快（但也还是比之前的 Gemini 1.5 Pro 更强大）的 Gemini 2.0 Flash。Google 也预告接下来还会推出更多样的模型类型。

而没等很久的时间，今天，他们也端出推出了进一步对应对手「AI 组合拳」的 Gemini 2.0 Flash Thinking 模型。更被视为是回应其他对手在推理模型（Reasoning Model）方面的发展挑战。

相对於透过 Prompt 咒语就能模拟的个性属性。OpenAI 在约莫 9 月的时候，发表了更专注於推理能力，并且在回答问题之前还拥有「仔细思考」特性的 o1 模型。简言之，就是相对於可以支援被打断对话与快速反应的 GPT-4o，要更谨慎思考，更适合科学、程式编写和数学等专精领域的 LLM 技术。

现在，Google 则是宣告他们的 Gemini 2.0 世代，也将分支出另一种类型的 Experimental Model 实验模型，名为：Gemini 2.0 Flash Thinking。

顾名思义，Gemini 2.0 Flash Thinking 模型就是会花更多时间思考的实验模型。官方描述这个模型十分适合多模态理解、推理和程式码编写的用途。还在开发者页面列出以下的应用范例：

・针对最复杂的问题进行推理
・展现模型的思考过程
・解决困难的程式码与数学问题

而面对已经早一步端出类似解决方案的 OpenAI，Google 则是也超级积极地在 Gemini 2.0 Flash Thinking 发表後，就以「gemini-2.0-flash-thinking-exp-1219」的模型名称在 Google AI Studio 启动了面向开发者的相关测试。

Gemini 2.0 Flash Thinking model 据报支援超过 128k 的上下文长度，学习资料的范围则是截至 2024 年 8 月前。
并可透过 Google AI Studio 与 Vertex AI 的 Gemini API 存取。

有意思的是，相对於 Gemini 2.0 发表时至少官方还会公布与自家 LLM 直接对决的成绩单。今天的 Gemini 2.0 Flash Thinking 却没什麽来自官方的表现数据 – 大概是觉得，既然都有更长的思考时间了，无论如何都必须要横扫所有自家的模型吧？

只不过即便官方没有拿出比较数据，Chatbot Arena 倒是第一时间端出了 Google 以及其他品牌如 OpenAI（包括 o1！）、xAI、Anthropic 类似等级的大型语言模型的比较。据报是 Gemini 2.0 Flash Thinking 都取得了首位。

假若 Gemini 2.0 Flash Thinking model 真的具备有这样碾压级的表现，显然就算是早一步开放并且取得不错评价的 OpenAI o1 reasoning model 应该也会有相当大的压力吧？

引用来源：Neowin｜

0 0 投票数

Article Rating

订阅评论

0 Comments

最旧