國科會TAIDE對話語言模型初步成果 翻譯、寫信、作文「還不錯」

因應ChatGPT等生成式AI迅速崛起,國科會今(14)日說明「可信任人工智慧對話引擎」 (Trustworthy AI Dialogue Engine,TAIDE)第一階段成果,除介紹計畫架構與方向,也展示7B(參數量70億)模型。

國科會主委吳政忠表示,TAIDE將以台灣文化為基底,融入在地特有的語言、價值觀、風俗習慣等元素,使其能理解和回應在地使用者需求,未來亦將逐步導入不同主題領域可信任的繁體中文文本,建立特定領域應用範例,提高模型對不同主題領域的表現。

國科會今日舉辦TAIDE計畫第一階段成果說明,國科會主委吳政忠(右五)主持,業界包括台智雲總經理吳漢章(左四)、聯發科創新基地總經許大山(左三)、玉山金科技長張智星(左二)等都出席參與。(圖/記者呂俊儀攝)
國科會今日舉辦TAIDE計畫第一階段成果說明,國科會主委吳政忠(右五)主持,業界包括台智雲總經理吳漢章(左四)、聯發科創新基地總經許大山(左三)、玉山金科技長張智星(左二)等都出席參與。(圖/記者呂俊儀攝)

他也說,生成式AI已被證明在多個領域中展現應用價值,其發展潛力超乎想像,希望在符合倫理準則的前提下發揮功能,模型產出內容也能符合大多數台灣人的習慣用語。

國科會打造TAIDE聚集國內相關領域最頂尖教授團隊,負責指導核心模型及對話學習技術開發;再加上轄下法人機構,如國研院國網中心負責建置新一代超級電腦,以提升算力資源,並提供應用服務平台;科政中心則負責徵集處理訓練資料。此外,數位發展部負責驗測環境架構發展,並針對本計畫所產出的模型進行評測,以提供可信任的證據基礎。

吳政忠透露相關計畫經費約新台幣2、3億元,但當中不含包括國網、各單位業界協助的資源投入。負責計劃的陽明交通大學應用數學系教授李育杰介紹,7B模型是TAIDE第一個產出的中模型,是在LLaMA原型的基礎上,由學界專家進一步發展及訓練調校。

他也說明,目前為止在計劃起步階段,時間、資料有限下,實測自動摘要、翻譯文本、寫信及寫文章等四個方面,TAIDE 7b均有不錯的表現,尤其對於繁體中文之處理能量及回答更為穩定準確。

國科會TAIDE對話語言模型初步成果,實測自動摘要、翻譯、寫信及寫文章等四個方面,均有不錯表現,尤其對於繁體中文處理能量及回答更為穩定準確。(圖/記者呂俊儀攝)
國科會TAIDE對話語言模型初步成果,實測自動摘要、翻譯、寫信及寫文章等四個方面,均有不錯表現,尤其對於繁體中文處理能量及回答更為穩定準確。(圖/記者呂俊儀攝)

目前TAIDE進入展示中模型階段,第二階段展示大模型,屆時將對於認識台灣、事實查核等等領域進行,對於何時進入商用,李育杰認為,將會在第三階段展示可信任模型時,結實信任將提升,也具備族覺產生不適當回應能力,有考慮倫理因素的問答上,最後才進到展示多輪問答階段。

廣告

吳政忠也補充說,國內優質資料的合法取得及整理還需要一段時間,未來將推出更大的模型及更多元的功能。下一階段,預計下半年可展示特定任務,並利用中模型與TAIDE合作夥伴共同開發其他功能,並於年底展示大模型(13B)及其具備阻絕產生不適當回應的能力,並釋出大模型供TAIDE合作夥伴。

吳政忠提到,TAIDE開發希望提供讓政府或業者,繼續發展專屬內部應用系統或加值服務,亦即後續各單位可依照需求選擇適用的模型大小,衡量所需算力及成本。

國科會表示,除學研界合作外,業界早期加入及協力發展,是後續推動技術轉化應用,以及AI技術普及進步的重要一環。本次記者會包括台智雲總經理吳漢章、玉山金科技長張智星、聯發科創新基地總監許大山等業界代表參與。

延伸閱讀

系統事業單位調整傳將大裁員?華碩:非事實!

施振榮:打造產業3.0研究園區 台灣應定位「全球研發製造服務中心」

國科會率團拜會英國創新科技部 針對AI、半導體、地緣政治影響進行會談

  • Yahoo財經特派記者 呂俊儀:資深財經媒體工作者,曾任採訪團隊主管,專訪過長榮集團創辦人張榮發、鴻海創辦人郭台銘,也歷經台積電創辦人張忠謀退休記者會等大事件,堅持產出最專業、富有洞見的新聞。