与 MBTI 人格测试的概念有点相似。尽可能贴近人类语言并且持续学习的大型语言模型技术,渐渐的也发展出了不同特性。继续阅读想得更仔细!Gemini 2.0 Flash Thinking 大型语言模型登场报导内文。
▲本篇图片来源:Google
想得更仔细!Gemini 2.0 Flash Thinking 大型语言模型登场
相对於心直口快(但也还是比之前的 Gemini 1.5 Pro 更强大)的 Gemini 2.0 Flash。Google 也预告接下来还会推出更多样的模型类型。
而没等很久的时间,今天,他们也端出推出了进一步对应对手「AI 组合拳」的 Gemini 2.0 Flash Thinking 模型。更被视为是回应其他对手在推理模型(Reasoning Model)方面的发展挑战。
相对於透过 Prompt 咒语就能模拟的个性属性。OpenAI 在约莫 9 月的时候,发表了更专注於推理能力,并且在回答问题之前还拥有「仔细思考」特性的 o1 模型。简言之,就是相对於可以支援被打断对话与快速反应的 GPT-4o,要更谨慎思考,更适合科学、程式编写和数学等专精领域的 LLM 技术。
现在,Google 则是宣告他们的 Gemini 2.0 世代,也将分支出另一种类型的 Experimental Model 实验模型,名为:Gemini 2.0 Flash Thinking。
顾名思义,Gemini 2.0 Flash Thinking 模型就是会花更多时间思考的实验模型。官方描述这个模型十分适合多模态理解、推理和程式码编写的用途。还在开发者页面列出以下的应用范例:
・针对最复杂的问题进行推理
・展现模型的思考过程
・解决困难的程式码与数学问题
而面对已经早一步端出类似解决方案的 OpenAI,Google 则是也超级积极地在 Gemini 2.0 Flash Thinking 发表後,就以「gemini-2.0-flash-thinking-exp-1219」的模型名称在 Google AI Studio 启动了面向开发者的相关测试。
Gemini 2.0 Flash Thinking model 据报支援超过 128k 的上下文长度,学习资料的范围则是截至 2024 年 8 月前。
并可透过 Google AI Studio 与 Vertex AI 的 Gemini API 存取。
有意思的是,相对於 Gemini 2.0 发表时至少官方还会公布与自家 LLM 直接对决的成绩单。今天的 Gemini 2.0 Flash Thinking 却没什麽来自官方的表现数据 – 大概是觉得,既然都有更长的思考时间了,无论如何都必须要横扫所有自家的模型吧?
只不过即便官方没有拿出比较数据,Chatbot Arena 倒是第一时间端出了 Google 以及其他品牌如 OpenAI(包括 o1!)、xAI、Anthropic 类似等级的大型语言模型的比较。据报是 Gemini 2.0 Flash Thinking 都取得了首位。
假若 Gemini 2.0 Flash Thinking model 真的具备有这样碾压级的表现,显然就算是早一步开放并且取得不错评价的 OpenAI o1 reasoning model 应该也会有相当大的压力吧?
引用来源:Neowin|