想得更仔细!Gemini 2.0 Flash Thinking 大型语言模型登场

与 MBTI 人格测试的概念有点相似。尽可能贴近人类语言并且持续学习的大型语言模型技术,渐渐的也发展出了不同特性。继续阅读想得更仔细!Gemini 2.0 Flash Thinking 大型语言模型登场报导内文。
▲本篇图片来源:Google

想得更仔细!Gemini 2.0 Flash Thinking 大型语言模型登场

相对於心直口快(但也还是比之前的 Gemini 1.5 Pro 更强大)的 Gemini 2.0 Flash。Google 也预告接下来还会推出更多样的模型类型。

而没等很久的时间,今天,他们也端出推出了进一步对应对手「AI 组合拳」的 Gemini 2.0 Flash Thinking 模型。更被视为是回应其他对手在推理模型(Reasoning Model)方面的发展挑战。

相对於透过 Prompt 咒语就能模拟的个性属性。OpenAI 在约莫 9 月的时候,发表了更专注於推理能力,并且在回答问题之前还拥有「仔细思考」特性的 o1 模型。简言之,就是相对於可以支援被打断对话与快速反应的 GPT-4o,要更谨慎思考,更适合科学、程式编写和数学等专精领域的 LLM 技术。

现在,Google 则是宣告他们的 Gemini 2.0 世代,也将分支出另一种类型的 Experimental Model 实验模型,名为:Gemini 2.0 Flash Thinking。

顾名思义,Gemini 2.0 Flash Thinking 模型就是会花更多时间思考的实验模型。官方描述这个模型十分适合多模态理解、推理和程式码编写的用途。还在开发者页面列出以下的应用范例:

・针对最复杂的问题进行推理
・展现模型的思考过程
・解决困难的程式码与数学问题

而面对已经早一步端出类似解决方案的 OpenAI,Google 则是也超级积极地在 Gemini 2.0 Flash Thinking 发表後,就以「gemini-2.0-flash-thinking-exp-1219」的模型名称在 Google AI Studio 启动了面向开发者的相关测试。

Gemini 2.0 Flash Thinking model 据报支援超过 128k 的上下文长度,学习资料的范围则是截至 2024 年 8 月前。
并可透过 Google AI Studio 与 Vertex AI 的 Gemini API 存取。

有意思的是,相对於 Gemini 2.0 发表时至少官方还会公布与自家 LLM 直接对决的成绩单。今天的 Gemini 2.0 Flash Thinking 却没什麽来自官方的表现数据 – 大概是觉得,既然都有更长的思考时间了,无论如何都必须要横扫所有自家的模型吧?

只不过即便官方没有拿出比较数据,Chatbot Arena 倒是第一时间端出了 Google 以及其他品牌如 OpenAI(包括 o1!)、xAI、Anthropic 类似等级的大型语言模型的比较。据报是 Gemini 2.0 Flash Thinking 都取得了首位。

假若 Gemini 2.0 Flash Thinking model 真的具备有这样碾压级的表现,显然就算是早一步开放并且取得不错评价的 OpenAI o1 reasoning model 应该也会有相当大的压力吧?

引用来源:Neowin|

admin

相关推荐

Comments

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
最旧
最新 最多投票
内联反馈
查看所有评论

热门新闻

0
希望看到您的想法,请您发表评论x