台灣AI資料治理現況與改進建議報告

基於監察院調查報告觀點

By Kuohua, built with Manus

六、結論與展望

主要發現摘要

本報告基於監察院調查報告,對台灣AI資料治理現況進行了全面分析,主要發現如下:

首先,台灣在主權AI發展方面面臨嚴峻挑戰,特別是繁中語料的匱乏成為主要瓶頸。TAIDE模型作為台灣主權AI的代表性成果,其公部門訓練資料集僅有58個,其中完整收錄於政府資料開放平台的更只有2個,政府網站符合公眾領域貢獻宣告(CC0-1.0)而可以直接爬取的網站僅占2%,這些數據反映出台灣在AI資料治理方面的嚴重不足。

其次,數發部在資料協作方面明顯缺乏團隊精神,繁中訓練語料的蒐集無系統性規劃,僅憑國科會計畫團隊單打獨鬥洽辦。同時,行政院未善盡督導協調職責,導致未能建構健全的文本資料生態系。這些問題反映出台灣在資料治理機制方面的缺失。

再者,台灣在著作權法規調適方面明顯滯後,目前僅有經濟部智財局一項函釋可供參考,在法律保留及明確性方面顯然不足,難以因應AI高速發展所衍生的各種著作權問題。這種法規環境的不確定性增加了AI開發者的法律風險,阻礙了資料的有效利用。

此外,TAIDE模型的應用推廣面臨多重挑戰,包括知名度和使用率有限、應用場景尚未充分開發、與產業需求對接不夠緊密等。同時,TAIDE人力資源不增反減的不合理現象,反映了人力資源配置方面的問題。

最後,台灣在算力建設與電力配套方面也面臨挑戰。雖然擁有強大的半導體產業,但在AI專用算力建設方面相對滯後,電力供應也面臨結構性挑戰,這些問題如果不能得到有效解決,將成為制約台灣AI發展的瓶頸。

通過與18個國家和地區的數據治理實踐比較,我們發現台灣在數據開放程度、法規框架、隱私保護、安全管控等方面都有較大提升空間。

政策建議重點

基於上述發現,本報告提出以下政策建議重點:

在資料治理機制方面,建議建立統一的資料治理框架,提升政府資料開放平台功能,增加可直接爬取的政府網站比例,建立跨部會資料協作機制,推動公私協力的資料生態系統。這些措施旨在打破資料孤島,促進資料共享和利用,為台灣主權AI發展提供充足的資料支持。

在著作權法規調適方面,建議修訂著作權法,明確AI訓練的合法性;制定AI著作權指引,提供明確標準;建立著作權授權和清算機制;推動國際著作權合作。這些措施旨在平衡著作權保護和AI發展需求,為AI創新創造有利的法律環境。

在應用推廣策略方面,建議加強TAIDE模型的宣傳和推廣,開發垂直領域應用示範,建立開發者社區和生態系統,加強人力資源投入。這些措施旨在提高TAIDE模型的影響力和實用性,促進其在各領域的應用和發展。

在算力與電力配套方面,建議加強公共AI算力平台建設,推動公私協力的算力建設,研發和應用算力節約技術,優化電力供應和管理。這些措施旨在為台灣AI發展提供充足的算力和電力支持,解決基礎設施瓶頸。

這些政策建議的實施需要政府、企業、學術機構和社會組織的共同努力和密切合作。政府應發揮引導和協調作用,企業應積極參與和投入,學術機構應提供技術支持和人才培養,社會組織應促進公眾參與和監督。只有形成全社會的合力,才能有效推動台灣主權AI的健康發展。

未來研究方向

本報告基於監察院調查報告和公開資料,對台灣AI資料治理現況進行了分析,但仍有許多方面需要進一步研究和探討。未來研究可以從以下方向展開:

首先,可以深入研究台灣繁中語料的特點和需求,包括語料的數量、質量、多樣性、代表性等方面,為繁中語料的收集和利用提供更加精確的指導。

其次,可以探索適合台灣國情的AI資料治理模式,包括資料收集、處理、共享、開放的機制和標準,以及相關的法律、政策、技術支持等方面。

再者,可以研究AI時代的著作權保護和利用平衡機制,包括新型授權模式、利益分享機制、合理使用標準等,為著作權法規調適提供理論和實證支持。

此外,可以探索TAIDE模型在各領域的應用潛力和實施路徑,包括教育、醫療、法律、金融等重點領域,為應用推廣提供具體方案和示範。

最後,可以研究台灣AI算力建設的策略和路徑,包括算力需求評估、建設模式選擇、資源配置優化等方面,為算力基礎設施建設提供科學依據。

這些研究方向的深入探討,將為台灣主權AI的發展提供更加全面和深入的支持,推動台灣在全球AI競爭中找到自己的位置和優勢。

免責聲明

本報告基於監察院調查報告及公開資料編寫,僅供參考,不代表任何官方立場。報告中的觀點和建議僅代表作者個人意見,不構成任何投資、法律或政策建議。讀者在引用或使用本報告內容時,應自行判斷其適用性和準確性,作者不對因使用本報告內容而導致的任何損失或問題負責。

報告生成說明

本報告系列為了測試Manus生成文件之內容的縱深度、正確度與精確度,以方便未來查閱檢核之用。本報告內容之生成過程,是與多個大模型多輪對話,共同協作生成此報告的草稿。本報告草稿尚未經過人工逐字審查。僅供參考之用,不宜在正式文件上引用。