随着生成式AI能力进步,去年底迈向广泛应用阶段,为了应对伴随而来的风险,我国政府公部门如何因应是当今焦点,例如,国科会7月中旬公告的公务机关生成式AI参考指引草案,行政院在8月31日宣布通过,要让行政院及所属机关在使用上有所依循,也促进其他机关参考订定自己的管理规范,而随着英文、简体中文版聊天机器人接连问世,国科会在上半年号召国内学术团队和国科会辖下机构,启动TAIDE计画,开始打造专为台湾使用者设计的可信任AI对话引擎--TAIDE(Trustworthy AI Dialog Engine),自今年6月第一阶段成果揭露後,如今9月将开始迈向大规模测试阶段。
在8月底举行的数位政府高峰会上,中央研究院资讯科技创新研究中心研究员兼资通安全专题中心执行长李育杰指出,TAIDE公部门应用即将开放测试,将率先於9月邀请部会报名,并於10月提供测试帐号。
今年7月Llama 2开放商业授权,促使TAIDE学研与商用模型发展更顺利
关於TAIDE的发展与应用,统筹相关开发工作的李育杰表示,今年初他们先是以开源大型语言模型BLOOM为基础,进行训练调校,但後续已经改用Meta开源的Llama,藉以获得更好的效能。
不过,由於Llama只有开放学术授权,因此他们当时规画是先做学术授权的版本,再进行商业授权版本的开发。
值得关注的是,最近一个多月他们有了很大的进展,李育杰指出,这是因为Meta在7月中旬对外释出的Llama 2,首度开放商业授权,这不仅让他们打造商用版TAIDE模型有了更好的基础,像是Taide-llama2-13B-Chat模型已显示相当不错的评估结果,更大意义在於,他们在学研与商用模型发展的经验与资源可共轨。
事实上,在最近一个月,我们看到各界对於Llama 2的应用相当关注的情形。如此看来,这绝对是TAIDE的整体进度变得更顺利的关键。
基本上,TAIDE是使用大量正体中文资料微调而成,融入台湾特有的语言、价值观、风俗习惯等元素,让这套生成式AI能理解与回应本土使用者的需求,加上正体中文的多元训练素材,将提升模型对不同主题领域的表现,并随着模型持续扩大训练,可使它更加厉害。
现阶段TAIDE提供何种应用?李育杰指出,他们的发展先聚焦在办公室4项日常生产力工作,包括中英翻译、自动摘要、写Email,以及出题目就能产生作文等任务,如今这些面向都有超越预期的表现,当应用在修改作文方面,也达到文句通顺、句子不重复的效果。因此,TAIDE计画团队将在9月初就会开始邀请部会报名,9月中开放试用申请报名,预计10月初就会提供测试帐号,让大家可以应用与尝试。
到了10月中下旬,TAIDE计画团队还将举行线上会议,并对中央政府部门举办工作坊,再扩及地方政府部门,向各机关人员介绍这套模型与使用教学。
李育杰指出,现阶段TAIDE开放测试的主要目的,是让与会单位能了解这套AI对话引擎,以及如何运用它,并且希望促使大家发想出更多应用可能性。後续公部门若有更多应用上的提案,TAIDE计画团队也将持续探讨可行性,并且就训练资料取得上获得进一步的合作。未来,TAIDE计画团队希望政府或业界都可基於这套AI对话引擎,根据需求,自行训练模型并建立内部应用。