🎞️🎧台版ChatGPT「TAIDE」為何重要?中央資工系教授蔡宗翰:AI就是國力,讓台灣不與他國產生數位落差
🎞️🎧台版ChatGPT「TAIDE」為何重要?中央資工系教授蔡宗翰:AI就是國力,讓台灣不與他國產生數位落差
圖說:中央大學資訊工程系教授蔡宗翰接受國立教育廣播電台節目及Podcast節目《新聞真假掰》主持人黃兆徽專訪。
國科會今年4月推出台灣版ChatGPT「TAIDE」,用來解決因多數大型語言模型都以英文訓練,對繁體中文回覆較不精確的狀況。TAIDE具備哪些功能?未來發展空間在哪?TAIDE專案模型組召集人、中央大學資訊工程系教授蔡宗翰接受國立教育廣播電台節目及Podcast節目《新聞真假掰》主持人黃兆徽專訪,表示TAIDE包含寫文章在內的五大基本功能已達商用標準,未來將著重在教育方面運用,並朝向讀取和理解圖片努力。
當全球都用同一個產品,本土文化將消失⋯⋯
自從OpenAI在2022年11月推出GhatGPT後,一年半的時間就改變全世界的學習習慣。蔡宗翰在教育現場觀察到現在老師出一道題,學生多半直接先問GPT,參考GPT所給的內容來撰寫答案。「這是我想到一個蠻細思極恐的地方。如果我們都只用GPT這個美國科技公司訓練出來的產品,那很多本土文化就會消失。」
ChatGPT雖號稱「讀完全網路上的資料」,但簡體中文資料量僅佔全部2%,繁體中文更是寥寥可數。在訓練資料絕大多數都是英文的情況下,「這也導致它產生的語言,本身沒有台灣味,也對台灣在地的情況不了解。」加上公部門的資料不能外洩,無法使用GPT帶來的好處來辦公,也讓國科會與蔡宗翰等AI領域專家們合作,僅花費四天就利用Meta的Llama 3訓練出TAIDE這個專屬台灣的大型語言模型。
目前TAIDE在中翻英、英翻中、寫信寫文章及摘要等五項能力已接近GPT3.5,具商用水準。蔡宗翰表示,AI就是國力的一環,如果我們長期使用國外所提供的模型,台灣將喪失自主研發的能力。此外,用英文向GPT提問可以得到很正確的答案,中文卻可能產生似是而非的回覆,誤導使用民眾。「這樣的話,其實會造成台美的數位落差。這些都是必須要自己一個大型語言模型很重要的因素。」
除了文書處理,還能作詞!一曲道出台版GPT發展歷程
節目中,蔡宗翰點播由TAIDE所創作的〈Trust in Taide〉,歌詞內容便是台版GPT的發展歷程。「某一天就突然有靈感,如果叫TAIDE描述自己的誕生歷程,搞不好我可以跟它一起做一首歌。」
蔡宗翰從TAIDE生成的七、八種英文歌詞中挑選出最好聽的版本,再利用Copilot等生成式AI畫一個主角來唱歌。「畫的時候有個秘訣,就是你要叫他正對鏡頭:因為側對鏡頭的話,生成的嘴型和動作非常怪。」
從蒐集多樣化資料,到培養多人對話能力,甚至讓TAIDE不僅能講話,而是講高品質的話,為期一年的專案歷經許多挑戰。透過讓TAIDE利用歌詞自我介紹,「希望大家相信TAIDE,歡迎來使用看看。」
下一步是「閱讀圖片」 提高工作生產力
蔡宗翰向大家預告,今年的下期計畫會是讓TAIDE讀懂圖片,具備理解圖片裡有哪些內容並將其轉成文字。未來也將因應現今學生學習自主性上升,而加重老師的教學負擔,提供大型語言模型幫助老師生成教材和測驗題,成為更值得信賴的學習工具。
「我們還是要去擁抱大型語言模型,避免你的競爭力慢慢被會用大型語言模型的人取代。學習掌握這樣的工具,嘗試為你的工作或生活提高生產力,帶來一些加速。」
【新聞真假掰|假訊息ByeBye!】由台灣事實查核教育基金會董事黃兆徽主持。節目中邀請各行各業的朋友暢談媒體議題,為聽眾提升媒體素養、增強對假訊息的抵抗力,希望達成「群體免疫」,讓大家都和假訊息說掰掰!
更多精彩內容請搜尋「新聞真假掰」,或上各大Podcast平台收聽,YouTube頻道則有訪談精華影片陸續上架。除了適合大眾收聽收看,也推薦各級學校老師在規劃媒體素養課程時可列入影音輔助教材。(撰文:紀泰永、張育騰)
【立即收聽】新聞真假掰 — 假訊息 Bye Bye|EP141|
Apple:https://tfc.pse.is/6293lu
Firstory:https://tfc.pse.is/6293nk
Spotify:https://tfc.pse.is/6293s5
KKBOX:https://tfc.pse.is/6293ux
【非聽不可的相關訪談】
AI時代的教育要先翻轉「家長」?數學滿分的關鍵是「閱讀素養」?
台積電如何成為「護國神山」?培育科技人才需重視「語言教育」?
【喜歡這集嗎?想對主持人或來賓提問嗎?】
🌟評分、留言這裡走|https://pse.is/4p9wyd
【好節目需要鼓勵~請給我們五星好評】
🌟訂閱、評分、留言這裡走|https://pse.is/4lblzz
事實查核需要你的一份力量 捐款贊助我們
本中心查核作業獨立進行,不受捐助者影響。