📻國立教育廣播電臺【新聞真假掰】語意分析、網路聲量有新的數據解讀?從ChatGPT看生成式AI創新領域的機會與風險。(逐字稿大公開)
📻國立教育廣播電臺【新聞真假掰】語意分析、網路聲量有新的數據解讀?從ChatGPT看生成式AI創新領域的機會與風險。(逐字稿大公開)
📻國立教育廣播電臺【新聞真假掰】節目資訊
播出時間:每周日 17:05-18:00
收聽方式:國立教育廣播電臺 官網 60 天隨選收聽
📌邀訪來賓
楊立偉(台大工管系兼任助理教授/意藍資訊總經理)
📌完整訪談內容Podcast
📌節目介紹
你的一生讀得完60億字嗎?AI一天就能讀完了。
ChatGPT問世之後,帶來無限商機與隱憂,透過不斷地餵養知識,ChatGPT不斷進行語意分析,再像一名24小時待命的圖書館員,隨時「調資料」給使用者。且這些資料不限於紙本,而是網路上的資訊,它都能蒐集與分析。未來,從輿情分析、文案生成到翻譯潤飾,都是生成式AI能服務的範疇。
然而AI的強大就像雙面刃,我們可能製造出「不存在的致命網軍」,在網路社群吹起一陣風,小則是衛生紙、雞蛋等民生議題,大則是銀行倒閉、左右總統選情……。唯一能避免這種危機的方式,只有人民重新重視編輯把關、篩選的內容,從事實查核做起,善用而非濫用AI。
本集節目邀請台大工管系兼任助理教授、意藍資訊總經理楊立偉,從ChatGPT,談到生成式AI的發展前景。請收聽「新聞真假掰 」,假訊息Bye Bye。
楊立偉(台大工管系兼任助理教授/意藍資訊總經理,以下簡稱「楊」)
黃兆徽(台灣事實查核教育基金會董事/台大新聞所兼任助理教授,以下簡稱「黃」)
📅節目預告
2023/11/05 周日 17:05-18:00 全台皆可收聽(查閱各地收聽頻率)
🌐最新精彩內容
AI機器人做長照服務的時代即將到來?人工智慧的3D影像技術如何改變人類生活?
----------------------------------------------------------
黃:Hello大家好我是兆徽,歡迎來到新聞真假掰,今天來到現場要陪伴我們一起提升科技資訊與媒體素養的好朋友,是臺大工管系、資管系的兼任助理教授以及他也是意藍科技的創辦人楊立偉,楊老師,楊老師好。
楊:黃老師好,大家好。
黃:楊老師今天想要來跟您請教一下,從ChatGPT看生成式AI創新領域的機會和風險,因為您同時在學界,然後又在實務界自己有一家科技公司,而且專門就是在做AI 了對不對?那已經是新貴。
楊:是新貴的掛牌的公司。
黃:是,這AI 新貴公司,就是臺灣的第一家。
楊:第一家。
黃:是,目前是唯一一家嗎?
楊:目前也是唯一一家,是。
黃:所以意藍科技現在有多少員工了?
楊:我們現在大概,人倒是沒有特別多,只有一百多位,可是我們在臺灣每天處理的文字的資料量大概是六十億字到七十億字。
黃:六十億字。
楊:而且已經累積了十多年,所以我們在臺灣處理AI 跟大數據應該是最有代表性,也是規模最大的團隊。
黃:是,您本身也是臺大資管系出生,所以從這個呃您從1999年,您說在研究所時代就開始創業?
楊:是,我們那個時候創業,在網路最早的時候,我們比較聚焦就是在做搜尋引擎跟語意分析,那個時候其實就是希望能夠讓所有的人都可以很快找到網路上的任何的資訊。
楊:所以在這一波這個生成式AI其實對我們是非常地興奮,我們也看到一個絕佳的機會,那當然我們也有可能會被淘汰掉。
楊:可是我覺得更是一個好的機會就是說,它現在在尋找資訊的方法跟這個過去接近二十多年快三十年,真的是有一個天差地別的改變,都可以讓更多人可以更容易地取得這些資訊,我覺得這是它最大的一個優點。
黃:是,剛從您這個的介紹裡面,您說當然有可能被淘汰掉,還是會有這樣的擔心嗎?
楊:是啊,我們我們雖然是在國內,之前是科技部有在辦這種與AI 對話的競賽,我們是國內一百三十多個團隊裡面的第二名。
楊:那可是就像我們已經做得這麼好,可是我們還是會面臨到很多技術的改變,像這次這個大型語言模型的改變,它真的在,我們只能講一句話,像我們這個領域的學者,真的是量變帶來質變。
楊:大家都沒有想到說,給它看了這麼多的書籍、雜誌、文字,看得量超過一定規模之後,它居然就會產生不一樣的反應。
楊:所以對我們而言就是說,舊的方法好像都有可能會被淘汰,可是所帶來的新的應用又是一個全新的機會,所以我也覺得這是屬於新的年輕人的世代一個新的技術的改變。
黃:您剛剛有提到說您這幾年都是在作語意分析,所以也有自己訓練的語言模型?
楊:是的,其實我們內部其實也有訓練這樣的語言模型,其實這樣的語言模型也已經應用在很多地方,像如果各位朋友所用的這種智慧輸入法,其實它就是一種語言模型,因為它會根據你一直打字它會一直修正,猜你下次,你就不用再去選字了。
楊:只是這次它這個可以連續閱讀這麼多字,而且它這個好像就已經它已經遍覽群書,問它什麼事情它全部都知道,所以真的是有一個很大的改變。
楊:那像我自己的經驗是說,我們可能以前都還要背很多、查很多的資料,那像現在我的女兒才唸小學,我也是教她大概半個小時,它馬上就會生成各式各樣的不管文字或圖片。
楊:那我們的公司更好玩,我們公司大概有一半以上都是工程師,在一次開會的時候不小心說溜嘴,說默默地他們已經全部也都是用AI在當成副駕駛來協助他們生成程式這樣。
黃:所以其實就是學會駕馭它比較重要,因為害怕,它還是會繼續往下發展,沒有用的,趕快瞭解它駕馭它。
黃:最近呢在這個楊立偉楊老師這邊有發表了一個paper,然後一個研究是AI 革命下的產業機會,用ChatGPT來看ChatGPT話題的網路聲量的洞察。
楊:是。
黃:我們這份研究發現了哪些事情是今天想要來跟您談談的。
楊:好,因為剛好我們就是在國內算是做這種輿情、網路言論分析的最大團隊,那就像剛剛提到。
黃:輿情跟網路分析,這跟媒體素養非常有關係。
楊:是是,那因為我們分析的對象有點是把從人移轉到是說他所生成的內容,所以我們是從這個大家網友所講的,在網路上所寫的這些文字來分析。
楊:那我剛剛講每天臺灣生成的六十億字到七十億字公開的資料,我們有收入的,當然也是用AI下去做統計分析,那這一次從AI裡面來看,我們就發現這個的確它在串起的普及的熱度其實是非常的快。
楊:那大家都有二派的人,一派是覺得說它是一個超棒的生產力提升的工具,所以他就會想要說怎麼樣可以讓他的工作,不管是學生或者是上班族,讓他的工作可以做得更快更好。
楊:那另外有一派人就會覺得說哇這個生產力工具的提升實在是太大了,所以他就會害怕,他會擔心說自己到底會不會被這一波這個淘汰掉,那根據我們的,我也再輔以,因為我們在團隊做這個研究做很久。
楊:其實這個生成式AI,它其實您可想像它就是讀了非常非常多的書,那它從GPT的第一版現在是到第四版,那其實很多人已經忘記它前面用的語料到底是什麼。
楊:那因為我們做數據分析的人,我們特別關心對於機器,你餵什麼給它,它就會變什麼樣子,所以其實數據原料是重要的。
黃:是。
楊:那這個GPT,光是第一版就以前Google有一個開放圖書計畫,它就把世界上所有的這種書,不管是這種著作權已經是過期的,或者是這種願意放出來的,或者是碩博士論文、期刊論文、書籍,它其實全部都唸過了。
楊:接下來還唸過這種世界上各地都有鄉民,它唸過這世界上最大有個叫Reddit的網站的所有的評論,所以它也很會回答鄉民的問題,什麼感情發生糾紛該怎麼辦?
楊:它接下來還在跑一樣是唸在網路上大量的輿情,所以當你是跟這些領域相關的話,我們覺得的確都會受到很大的影響,像裡面我們從報告裡面看到,這種重複性多的,坦白講就是以背誦為主。
楊:舉個例而言,有些領域可能以前大家都覺得跟它不相關,可是現在都嚇一大跳,比如說律師,那律師當然他也是還有他這個案例分析的部分,可是在條文的部分,這個GPT它看過得,比他比任何人都還要多。
黃:而且它看過的判決,看過的這個各個國家,臺灣或各國的相關的判決的判決書、所有的法條、學者的見解、著作,它都看過。
黃:其實我自己也是法律系畢業,其實當我剛接觸到的AI這半年、一年,我就已經提醒我法律這個朋友、同學們說,要小心,我們怎麼背也背不贏AI,對不對?我們讀過的資料量,也不可能比它多,那這種時候人剩什麼?
楊:是,所以像這種就要注意啊,如果你只是層次是一般講說法務助理。
黃:你只會寫判決書。
楊:這將來都是AI小書僮來幫忙,另外還有很驚訝的是這個醫生也是,除非你做了什麼臨床更前的,因為醫生要背的東西也好多,不管是這個各式各樣的從部位、器官、疾病到藥,這個要背的實在太多。
黃:對,什麼症狀要開什麼?什麼藥跟什麼藥會衝突?
楊:長期的這些基礎,基本的醫學的部分,其實AI比你看得還要多,所以它的確給我們好大的啟發,就說那這些很多重複性的可能,就比較反而在這次是,以往想像是勞動或者是自動化機器人,這一次反而衝擊的是知識工作者。
黃:對,以前就是AI說有大量的機器人在工廠裡面可以替代掉很瑣碎、機械化的流程、生產流程,這次是坐在電腦前的人被威脅到了。
楊:沒錯,然後這份報告裡面看到還有,除了這種AI會生成文字之外,其實接下來還有一個更大的產業是生成圖片,那生成文字的部分,我們用這個報告來看,其實大部分的人都接受度很高,所以都已經開始在用。
楊:那反而生成圖片的會產生很大的二極化,有的人開始用,然後有一派會非常非常的反對,那裡面就是因為它的效率的提升實在太多了,因為你寫一篇文章可能原來寫半天,現在變成10分鐘,這個還好。
楊:你原來畫一張圖可能要畫一個禮拜都畫不完,結果它現在也是1分鐘就出出來了,所以它的影響更大,那大家就會擔心說這個比如說著作權,還有它的很多的利益上面的問題還沒有得到解決。
楊:所以現在反而從這個報告裡面看到,有一群人是對於AI 生成,他甚至是抵制的,那以我們的角度在看,我們覺得這個都是在過度的現象。
楊:因為你這個就好像當初串流音樂剛出來的時候,唱片公司也都抵制,可是其實是沒有找到一個平衡點,其實等到找到平衡點之後,我們相信這個平衡點應該很快就會到來。
黃:被迫到來。
楊:被迫到來,其實很多這些人,其實大概預見在各位朋友,或者是我們覺得在2到3年之內一定都會解決,一定就是人人都有一個AI小書童、AI小畫家、AI副駕駛的日子一定會來。
黃:是,所以我們這份報告,它是研究方法是什麼?先跟聽眾分享一下。
楊:好的,我們這個研究方法,它很特別就是說它是去蒐羅在網路上所有,我們一般只要稱之公開的輿情,所以裡面有包含了這種報章、雜誌、研究媒體分析報告,這是比較專業的。
楊:那也有包含了這種網友的討論,譬如說在社群、社團裡面的這種不安感,或者是有些人是做成果的分享。
黃:社群包含哪些社群?
楊:我們這個社群裡面就包含了臺灣比較常用的,包含像Facebook、Youtube、Twitter、IG,甚至現在比較新的像tiktok抖音等等,也都包含在裡面,那也包含了這些討論區,包含了像PTT或Dcard這種各式各樣的討論區在裡面。
黃:所以你們的AI已經可以進去這些討論區裡面去搜尋,而且去理解裡面的文字?
楊:是,我們其實就會。
黃:包括影音都可以了?
楊:影音的部分我們現在處理,因為現在的確在影音的處理上面,需要比較大的耗能,算力要很足夠,所以我們在目前是以文字為主。
楊:可是這些影音網站只要它旁邊有什麼標題、內容、下面的網友的留言、hashtag等等,它也都會分析,那有些重要的頻道,或者重要的意見領袖的,我們就會做內容的分析,是可以的,對。
黃:是,所以幾乎搜尋了所有的公開的媒體報導還有社群討論,都是在所謂輿論的聲量的範圍裡面。
楊:是,所以我們這個輿論輿情的研究,用的這套AI去運算的方法又有一個名字叫社群聆聽。
黃:社群聆聽。
楊:它就listening,listen to people's voice 聆聽民眾的聲量,所以剛好它對照的就研究聲量的方法就是聆聽,那您就想像就是說,好像是派出AI去大量,也是小書僮的概念,它幫你看過這麼多內容之後幫你摘要,然後幫你分門別類,幫你整理出來。
楊:這個我們自己在內部,我們也說這個如果這個團隊再不努力,這個將來也是全部AI會把這個輿情的分析報告就完全都做好了這樣的。
黃:是,所以我們剛剛的研究發現,您剛剛有提到幾點,然後還有什麼很有趣的發現?
楊:那我們裡面還有幾個發現,就是說其實這個大家就會開始討論這到底是拿來做什麼用比較好?因為有些人會對原理很有興趣,瞭解完之後,大部分人說那到底能幹麻?
楊:那能幹嘛裡面,我們有找到幾個比較有趣的,大家第一個就是拿來寫作業、拿來寫論文、拿來寫文章,第二個是拿來寫程式。
楊:然後第三個其實就是拿來生成各式各樣的圖片,那這個圖片有連帶好多行業,其實在從這個網友的鄉民智慧的討論裡面就看到。
楊:像比如說原來本來跟AI 可能沒什麼關係,像攝影師、模特兒、商品照片,現在還有那種cosplay 的,好像瞬間忽然都很有可能會被AI影響到。
楊:所以這個它的影響範圍真的是很大,那我們剛剛就看到說,如果還有幾個包含像翻譯,因為這次的這個大型語言模型,因為它匯入的資料實在是夠多。
楊:那本來我們在做語意分析的人,都會有一題就是做機器自動翻譯,沒想到這一題也瞬間解掉了,它的這個翻譯的水準。
黃:比Google翻譯更強大。
楊:實在是好太多了。
黃:為什麼?它的原理上,為什麼它可以這麼強大?翻譯。
楊:沒錯,但因為它,它除了真的是有去做到不同語文,因為其實對AI 而言,它根本才不知道這是哪一國的語言,它覺得這全部是符號。
楊:那當你把這些符號放進去之後,有純中文、有純英文的、純日文,也有中英日混合的,它自己就會去對照出這個,在語意空間的一個角度。
楊:比如說我們在臺灣,比如說教小朋友會講說,這個太陽啊、月亮啊、八大行星啊。
楊:那英文也有教材,就會說講到sun啊、講到moon啊,講到八大行星,它自己會從這個它彼此對應的關係,就找到這個太陽、月亮跟八大行星的英文的說法,其實它就會自己就會找出來。
楊:那瞬間解掉了六十幾國語言的這種很流暢的翻譯的問題,那除了這樣的之外,其實剛剛這個兆徽也有提到,就是說其實這個GPT它還有個很強的能力,它是背多分,就是背了考試就很高分。
楊:它其實沒有運算跟推理的能力,可是它背是超厲害的,所以它還背過了這些所有的,我剛剛講到它的GPT第一版就是以書,書又是這麼結構化,這麼高品質的資料。
楊:所以那些各式各樣的文學名著,優美的各式各樣的文學作品,它全部都唸過,那各位朋友你只要做一個測試就可以了,你故意打幾個字叫Google 翻譯跟叫GPT翻譯。
楊:千秋萬世一統江湖,這個Google 就會照著翻,因為它不知道這是什麼東西,它就說這個什麼Unified the river and the lake,就江跟湖。
楊:結果這個GPT各位去試,它就會寫說to unified the martial world,它說是統一這個武俠世界,你就覺得它實在是太厲害了。
黃:它還一統江湖,它還有catch到武俠這樣的概念。
楊:是,可是就有很多的,因為也有很多youtuber或很多人就講說,它一定是太神奇了,其實它一點都不神奇,我告訴各位為甚麼,因為它看過金庸的英文版,所以它會喚起它的金庸英文版的記憶。
楊:那像舉個例子這個之前Apple的前創辦,就創辦人Steve jobs他講這個有一句話你叫它英翻中,剛剛是中翻英嘛,那各位再去試Google,你去試叫它翻一句話叫做stay hungry, stay foolish。
楊:那google 就會翻譯說這個叫保持飢餓、保持愚蠢,你就說這到底再翻什麼,結果那個GPT 它就會翻說這個是求知若飢。
黃:求知若渴。
楊:然後求什麼若愚,就它翻了其實當年的中文世界的雜誌的翻譯就是這樣,所以它其實是吸收了大家的精華,而且有一個超強的記憶,所以它會喚起所有的記憶。
楊:所以用這二個例子,你就可以知道說,它不只是語言模型在運算量的進步,它同時間還記得了所有人類之前這些累積的智慧,那不過當然也暗示了一件事情,它用的時候也有風險,如果是它之前沒看過的,它就會開始瞎掰。
黃:亂掰。
楊:對,它就會發揮它,如果我們稱組合是一種創造,那它創造能力也很強,就它是組合式創新,那我講一個有趣的小故事就說,因為我對我的女兒,我都在教我的女兒,中間會有很多人工智慧跟語言的啟發。
楊:因爲看她這樣子長大,然後我就覺得很有趣,有一天我就跟她說哇這個爸爸領域出了一個大事嘛,因為GPT 是11月30日發佈的,我從12月2號我就拿給她玩。
楊:我就說這個你要不要試試看?有個比siri還有Google 聰明一百倍的東西,她拿來說真的嗎?可以這樣嗎?她就問它,她就隨便問了它一句說哆啦A夢是什麼?
楊:然後因為ChatGPT,我等一下可以跟各位介紹,因為它的訓練的語料的這個級,大概從四百多梯裡面挑了四十梯,一梯是大概是一兆字,它大概用了四十多兆的符號下去訓練。
楊:中文只佔將近五分之一,佔20%,可是很遺憾的繁體中文大概只佔0.6%不到,所以它對繁體中文的符號的理解。
黃:辨識力。
楊:其實沒有像英文或做其他的那麼強,所以它可能沒有看過繁體中文的哆啦A夢這到底是什麼意思,它就開始亂掰,它就說它是毛利小五郎養的一隻貓,對,那這個毛利小五郎是這個名偵探柯南的一個角色。
黃:它把二個卡通混淆了。
楊:對,因為它可能真的沒有看過類似的訓練的資料,所以它就開始亂掰,那這個就是大家要用的時候,反而要去回想或回推到底這個它曾經看過哪些資料?如果你可以順著它。
楊:比如說它一定有看過這種歷史上,比如說英法發生過幾次戰爭?分別原因是什麼?成果是什麼?這個都是非常結構性的,而且是書上都有的,它都可以回答得非常非常的好。
黃:還有呢?在這份報告裡面,我看你們也討論了ChatGPT話題聲量的趨勢?大概是一個什麼樣的趨勢?
楊:我們裡面這個趨勢其實就是,我們用那個類似像技術擴散理論,其實這次真的是一個新技術擴散最快的,有很多的證據都有顯示。
楊:比如說它最快就突破上億的使用者,那以人類在接受的時候也是一樣,我們剛好用這個數據可以來印證,其實在臺灣民眾相對應的這個討論的最高峰從去年12月到現在5月的話,其實高峰是已經過去了。
楊:大概在2月到3月的時候達到一個大家最高峰的時候,那我們一般在從這裡面看到就是說,這個大家有時候會開始對它有一點過度的期望跟想像,那這是必經的過程。
楊:然後到最後,我們接下來開始大家又會說可是它裡面好像有好多錯啊?這樣子到底真的可以用嗎?大家就開始做反思。
楊:那我們看到的是說,其實開始即將要進入到穩定,那這個這個可能會比大家想像中的要來得快,所以就是說,可能你接下來的這些,就像我剛剛講,我們公司的同事在默默的已經很多人都在用了。
黃:就開始用,也不用太討論。
楊:是,所以它看起來這個有趣的地方就是說,看起來好像聲量下降,可是討論的內容卻越來越具專業,就是它已經真的找到了某些領域,就是可以實際上去運用的,那這個可能在今年就會完全發生這樣。
黃:是,之前都是在看熱鬧,現在看門道了。
楊:對對對對對,就是開始真的在用的人就會越來越多,所以從之前大家本來想像只是,我再講一個更有趣的研究,這個實在是對我們這個,實在是一篇很新的論文,衝擊也實在太大。
楊:大家本來都想說它大概只會做作摘要、寫寫詩詞、小說、故事啊,然後還可以做客服問答,這是我們對它第一波想像。
楊:那在我們透過輿情,然後還有看,它也會去分析國外的一些資料,我們就發現說有一篇實在是太有趣的研究,它說這個原來這個大型語言模型會被大家罵的就是說,它會有一些歧視存在裡面,比如說它就會有性別歧視。
黃:對,只要寫護士,它就會寫she嘛,用女生的她。
楊:沒錯,它就會有種族歧視,然後你問它。
黃:某一些職業的刻板印象。
楊:對,它就有一些偏見在裡面,那本來大家想說這是個缺點,結果居然有的人就想到這個分佈其實很接近真實世界餵給它資料的分佈。
楊:所以它說如果它是跟真實世界的分佈是一樣的話,那我們以前還會做很多訪談、問卷。
楊:現在是不是都可以透過下咒語,讓這個AI 變身為比如說催眠它說你是一個住在臺北市大安區40歲到50歲的男性,你是一個上班族,然後你平常在幹嘛。
黃:所以以後要做民意調查不用問真的人,還會被掛電話,直接問ChatGPT就可以了。
楊:這就是國外現在做得叫AI server,叫virtual server虛擬調查,它會變成千人千樣,然後你去問它,那最妙的是大家會想說這樣會準嗎?
楊:結果沒想到居然跟現在國外是拿總統大選例子來做,居然跟之前問總統大選的例子民調只差幾個百分點而已。
黃:就跟問真人一個一個問的結果,跟現在問ChatGPT的民調結果是非常趨近的。
楊:對,所以大家就想說天啊,那以後難道真的是可行嗎?大家當然滿頭問號,可是隨著資料慢慢出來,專家說哇那很多的研究方法,很多我們的工作,現在連這種連市調也。
黃:也要被取代了嗎?
楊:也要被影響了,所以真的是,大家就如同我講的,就是說看熱鬧的看起來好像已經稍微有消退一點,可是實際上它在各行各業的深度就越來越深。
黃:所以大家都要看,現在要努力的各個產業都要想我要怎麼運用ChatGPT了,所以我們再回到這個報告,話題的好感度上面,這個是什麼樣的調查結果?
楊:我們現在會用這個AI也去判斷這個輿情,或這個言論,大家我們會去判斷二種,一種就是它的情緒是正面還是負面的?
楊:還有它的立場到底是支持或是反對這件事情?那這個大型語言模型其實真的也解決掉很多事情,像以往我們都會這個去,如果只是用字詞比對,我們常常會產生這種誤判的現象。
黃:對,比如說什麼好棒棒,可是其實是一個嘲諷對不對?
楊:對對對,可是現在的AI就很厲害,它會根據你的上下文來決定你好棒棒是嘲諷還是是真的,像比如說你如果是在PTT 講好棒棒,就是在酸你嘛,可是我們的資料發現說,如果他是在親子寶寶的社群裡面講好棒棒,那是真的。
黃:那是真的很棒。
楊:是爸媽真的在學小孩講話,真的好棒棒,所以那個準確率真的。
黃:爸媽真的很善良。
楊:是是,就是提升了很多,那提升很多的情況下,我們就會發現這個在,在這個AI在生成式AI在情緒好感度上面,其實反而是拿來做幾個用途是好感度最高的,其實我們看到一個很驚訝的是大家覺得健康議題。
黃:健康議題跟ChatGPT的關係是?
楊:就像你可能自己有些症狀,或者有一些飲食,或者說你要說可不可以開一個,我想要減肥,開一個健康的菜單給我?
黃:有些健康諮詢的功能。
楊:對,其實這個,反而網友發現這個它都給出一個真的是相當不錯的建議,在這裡我們想說這個是情緒好感度最高的。
楊:那另外其實就是這個推薦啊、旅遊啊、餐廳啊這些推薦,因為有時候我們真的在用Google或搜尋引擎的時候在找資料。
黃:要找很久。
楊:真的是要找很久,有時候就是說可不可以幫我推薦一個什麼CP值最高的素食餐廳?或者我想要買一臺印表機,可不可以就告訴我前十大該選擇的印表機?可是通常你這樣問Google,通常可能會跑出一大堆內容農場的文章。
黃:對。
楊:就是說它是來騙流量的,可是GPT它會真的消化之後,然後再用一種口譯的方法來給你回答,所以這個在給予人類建議的部分,其實好感度真的是很高。
黃:是是,不過當然大家還是要提高警覺啦,因為它所生成的內容真的不見得是正確的。
楊:沒錯沒錯。
黃:所以你看到了一個看起來頭頭是道的東西,還是要想辦法去查證一下。
楊:是,所以其實要給大家的建議就是說,可能可以把它當成是很不錯的一般所謂的second opinion就第二意見,那你至少會拿到一個意見,那你可以再去跟不管是Google或者還是要徵詢醫師。
黃:專業的。
楊:專業或醫師其實會相當的,更好,那這個時候其實也帶出來就說,那可是如果是一些太新的,它現在目前的資料還沒有到更新到很新,然後越是local當地本地的資料,可能。
黃:相對比較少。
楊:相對少,所以像你去問它,如果問它去美國旅遊要玩哪邊?它都回答超棒,結果你問它新竹的十大小吃,它都答錯,就它都答錯這明明不是新竹的小吃,所以在用的時候的確是還要再更加的小心跟求證。
黃:是,對,所以查證還是在使用ChatGPT這類生成式工具最重要要提醒大家的,尤其他它很容易變成一個假訊息散播的一個溫床了對不對?
楊:是,那我們自己在做輿情分析,其實我們這個這種業者最大的隱憂就是,我們內部就在講說,我們現在每天是收集六十億字到七十億字,我們預估。
黃:它會大量的生成內容在網路上。
楊:我們預估年底我們可能就要準備五倍的量,可能到明年要準備不知道多少倍的量,因為大家接下來,網路上看到的真的,因為生成的成本大幅下降。
黃:太低了。
楊:對,所以這個資料量的產生會更高。
黃:對,以前我們可能要一個小時才寫一篇五百字的文章,現在二秒鐘ChatGPT就產生了。
楊:所以現在對於我們這種業者或對搜尋引擎,或者說對每一個人要能夠慎選、篩選數據是更加的重要。
黃:對,資訊媒體素養會更重要,對不對?因為內容會太多太多。
楊:是,它是一個內容有人講說叫內容通膨,有人講說是內容氾濫、爆炸的時代,那其實我們倒是有看到另一個商機跟產業,就是說其實接下來就會,其實OpenAI 自己也有放出一個工具是用來偵測,是不是。
黃:哪些東西是用ChatGPT生成的。
楊:那它當初會要這樣偵測的原因,它的用意只是說,它要避免就是說,因為它會再拿很多資料再來做,你是網路上蒐集的再來訓練,結果它搞不好爬到的是一堆。
黃:自己,ChatGPT生出來錯誤的訊息。
楊:而且更慘的是ChatGPT3.5跟4生成的,結果拿來它訓練5,所以你是拿上一代的生成來訓練下一代,這好像感覺怪怪的。
楊:所以他們為了,其實很多科學家其實最後開始要避免這個事情,所以他們的確就會讓,一方面是推行就是說生成的時候就要標註,或者它儘可能要有一些隱藏式的pattern模式在裡面。
黃:浮水印啊或者是要標註來源說這一段是來自ChatGPT。
楊:那它就會之後他們在訓練的時候也會自動排掉,那隱含帶來一個就是說,那將來就好像病毒跟防毒軟體。
楊:將來也會有這種偵測是由人類,或者機器所生成的內容,我們想像可能也會這樣的工具來協助我們,更有效的把這些完全只是機器生成,比較淺層而不是深度。
黃:不曉得真假的。
楊:不是人寫的,對,把這些內容把它過濾掉,我們覺得這個是可能也蠻有潛力的一個產業。
黃:一個商機。
楊:因為需求很大,因為不然大家都實在是。
黃:都真假難辨的訊息會更多,對不對?
楊:是是是。
黃:這份報告裡面還有什麼重點?
楊:是,那其實我們也可以跟朋友們來分享說這份報告是怎麼做出來,其實我們就是利用這種AI機器人去大量遍覽臺灣的社群新聞報章雜誌、討論區的內容。
楊:剛剛有提到了,一天大概看六十億字到七十億字,那我們這邊看完的還有一個歸納就是說,那現在在臺灣的這些訊息到底都是怎麼傳播的?
楊:像我們發現這個ChatGPT在臺灣,它剛開始其實是在一些比較專業圈圈領域裡面傳播,那它本來只是在一些同溫層裡面。
楊:那後來其實是透過了這些現在很多議題也都是透過網紅、關鍵意見領袖來做傳播,像比如說中間有一位這個是老高與小茉。
楊:這個他的這個影片在臺灣其實看的人真的是很多,所以達到一個最高峰在2月23號的時候,居然就會達到有非常多人都在關注這件事情,居然是因為這個網紅提到了。
黃:什麼事情?
楊:對,那他提到的時候就想說,哇這個到底他的後面的擔心這些不確定性跟未知性,其實就帶起了很多的這樣的問題,那後面有更多的這些網紅或者意見領袖其實就一棒接一棒,就會把這個傳播這件事情就讓大家更加去瞭解這個技術。
黃:是,您剛剛說因為老高與小茉在某一天他們討論了影片主題就是ChatGPT,然後提醒大家說一切才剛剛要開始,我們要做好準備了,因為他們的這個影片的發佈,就造成網路一個非常高的聲量。
楊:是是是,明顯的高峰。
黃:是是,這個明顯的高峰會比平常高多少倍?
楊:他其實以我們來看的話,其實他當天的這個討論,就打一個比方就是說這件事情最高峰其實就是從他那個地方開始後來就一路往上,那應該是提升了至少有五倍之多。
黃:哇,一部網紅的影片可能讓整個網路世界,你們觀察到的所謂輿情,因此這個相關話題熱度提高五倍。
楊:是,那那像這個有些事件,像這個譬如說如果是AI生成圖片,則是有一個這個也是一個很有名的作家吳淡如,她在網路上面就有人提到說這個她做的。
楊:就是大家網友在討論說到底是電腦繪圖還是叫AI生成?這個就引起了很多人的討論,然後連帶也影響很多不知道的人去接觸這個。
楊:所以以我們在看,這個網路傳播,就說為什麼我剛剛有提到一件事情說那這個將來AI的內容生成越多,那網路上的資訊勢必又會再翻倍更多,那這樣子更多的情況下,那到底我們是應該篩選不看?還是是要認真每篇都看?或者說以我們。
黃:如何篩選?
楊:對對,或者以我們的立場說,那產業可能要怎麼來用這個事情?
黃:對,當有這麼多的東西在網路上的時候,我們怎麼觀察所謂的輿情到底是什麼?
楊:是,那我們在做這個AI判斷輿情跟分析輿情,有一個很重要的題目是,我們以往的確有一題,就很多老師也跟我們合作就說,要判斷這個訊息到底是真的還是假的。
楊:那我們就會建很多訓練資料,然後再去讓AI做判斷,可是後來發現這個判斷,其實就一直準確率都沒有很高,我想這個兆徽一定很熟,那因為為什麼?因為你拿給一個人看,人也看不太出來,所以你叫AI判斷很高,這也是強人所難。
黃:就要判斷真假,做事實查核其實很花時間,也很花心力。
楊:很花時間,真的很困難,那我們後來變成是AI還有一種優勢是速度快,我們後來把這個判斷的方法移到是說,那要先判斷影響力大不大?
楊:就說這個輿情的這個,同樣我們稱作輿情就是在網路上的網友的一篇言論,這樣一篇我們就叫一則聲量,所以它的單位不是一位網友,是單位是一篇或一則文章。
黃:所以一個網友他發五篇文,他就算是五則?
楊:五則聲量,對,所以的確這個聲量就是說,他沒有辦法跟人完全對應,可是他還是有個代表性的關係,就是說就是說這個,每個人會發言的或者是發言的內容還是會在長期觀察之下,還是有一個趨勢。
楊:那我就發現是要去判斷到底他有沒有影響力是一個重點,因為如果一個人他算講很多假的,他就譬如說一天到晚在那邊癡人說夢,每天都講網友都最常講說我夢到什麼。
黃:對,我做了一個夢。
楊:對對,那也沒有人在關心他講什麼,其實坦白講我們是不太需要去知道這到底是真的還假的。
黃:對,有的網友他就算每天講,或者是他一天發十篇,其實沒什麼朋友或沒有什麼人閱讀,他的影響力就很低,對不對?
黃:但有份量的人就算他一個月發一篇,他那一篇就很有可能很有影響力,所以影響力跟聲量要怎麼看?
楊:那應該是說聲量其實就是一個很好去判斷影響力的方法,因為他如果有個論點,然後他寫了一篇文章,像我們通常還會再去分析說這個人的文章跟它相似的主題還有哪些?那誰是第一個人發的?
楊:就是說我們還有一個溯源的概念,然後以及這個文章發出去之後下面有多少人按讚、留言、分享?這些數據如果是公開的,我們也都會取得,所以我們就會去計算它的影響力指標。
黃:影響力怎麼計算?
楊:對,那舉個例我們就會用一些加權的公式,那這個加權公式有些是AI 算出來的,那有些是比如說專家他就會說那每一則留言可能得幾分?一個按讚得幾分?
楊:然後再一個轉貼可能分數又更高,因為我們一般會認為是說,按讚比較容易,留言需要成本很高,那轉貼。
黃:按讚只要幾秒零點幾秒。
楊:對對對。
黃:留言還要花時間想要留什麼。
楊:那如果是分享,就有病毒擴散的效果,所以我們就會利用這個方法去算,那現在。
黃:就是按讚、留言、分享,分別給它不同的權重。
楊:那我們經過這樣子的去計算影響力,現在還有個很重要,像我們這種團隊,我們在做就說,現在很多訊息其實是平臺碎裂化。
楊:碎裂化的原因是說,比如說有的人是他在Ptt po一篇,然後有了記者可能就去轉述它,然後在臉書上又有人再轉這個記者的,然後最後又拿到IG、Line裡面去傳。
楊:所以你可能沒有辦法有一個工具可以全面性地去把它拼起來,所以像我們在做的就是,可以把多個平臺的這樣的內容可以把它串起來。
楊:所以你大概就可以知道同樣這個言論,像我們剛剛會算說某些網紅提到這個ChatGPT它其實就是合併多平臺之後計算出來,然後看得出來它這個影響力是最高的。
黃:跨平臺的影響力是怎麼樣的一個模式來觀察?
楊:我們其實就是把它,最容易地就是把它放在一個時間線上面,那因為我們現在ChatGPT它可以去比對我們這樣的內容到底相不相似,當它相似度很高。
楊:比如說有某一種言論它的相似度很高的情況下,我們就會把它,姑且把它合併就說,那它可能是,我們就假設它可能是因為受了誰的言論影響所來再去散佈或傳遞的。
楊:那這個時候雖然它已經是平臺是不一樣的,可是我們已經把內容主題稍微把它合併,然後把它放到時間線上就會看到這種很有趣的,我剛剛講的這種一棒接一棒的效果就會出來。
楊:那我們這樣子做的用意其實是要真的去看到說,到底哪些重要的話題在我們的這個網路世界是真的有影響力的。
楊:因為將來一定會有更多類似這樣的這種虛假訊息真真假假,那我們沒有辦法窮盡力量,因為我們的服務的對象其實是商業跟品牌,其實他們也有同樣的問題。
楊:就是說這個有人,一方面他們有的人是要關心假訊息,像他們是關心負評訊息,就是說這個有一個網友來寫一個負評訊息,那他們其實有個關鍵是說到底要不要處理?那當然這邊的我們的意思處理不是要去處理那個網友。
黃:處理這件事情。
楊:對,處理這件事情,你也不能對他做什麼處理,所以沒有什麼負面的意思,只是是說因為他們公司內部,就好像你有客服單位嘛。
楊:那你客服單位編制有限,你要真的去處理,你只能抓大放小,或者我們其實就有一種,我們後來分析就是說,這個網路上本來就是有真有假才正常啦,有正有負才正常。
楊:你不應該去消滅每一篇負的,或消滅每一篇假的,因為這到後面判斷很困難,而是說這個當它影響力開始串起的時候,我們就要把它抓出來。
黃:所以企業就要做危機處理了?
楊:對,所以我們裡面倒是的確有建了很多這種AI 的指標,就是說什麼樣的東西是在多平臺,同一個主題呢然後叫做串起,那我簡單講一些這個公式給朋友們聽。
楊:像我們就會去算,這個話題的這個比如說2日平均線跟30日平均線,如果它的2日平均線突破30日平均線,就代表在上升波段。
黃:2日平均線是說這個是網路聲量?
楊:對,網路聲量的2日平均線跟30日平均線,那我講到這邊,大家會覺得好像忽然進到第四臺的股票分析師,說什麼有一個黃金交叉,然後有個死亡交叉,其實就是有很多數量的方法,其實。
黃:就是某一些比如說一個精品的品牌,它很在乎它的品牌形象,它就要觀察說大家在社群上是怎麼討論這個品牌的對不對?
黃:您說其實負評其實更值得要注意的,到底是對手在刻意散發負評呢?還是網友真的有什麼對什麼哪一點不滿意?然後這個負評會不會影響到更多人也一起連帶的負面印象。
楊:是,然後再去計算說到底它是在影響力是在擴張的階段?還是是說已經。
黃:快要下,快要消失了。
楊:快要下來的階段,然後我們就會從中間去做很多指標做這個分析,那另外一個。
黃:比如說什麼樣的指標?
楊:就如同我剛剛所講,這種快速移動跟慢速移動平均線,或者說你的這個討論量,平常平均。
楊:因為每種話題,不管是政治人物或品牌,它真的在網路上討論量都會有一個平均值的概念,那你這個如果背離這個平均值,這是有點像。
黃:就異常了。
楊:叫乖離率,就是說你離開這個平均值標準差幾個,比如說離開三個標準差,這個就是代表非常異常的狀況,你可能就要特別地注意。
楊:那我們除了會去觀察,其實輿情有這些用途之外,其實輿情另外一個用途就是說,除了剛剛講的這個瞭解公關危機處理之外,判斷影響力,不是判斷真假而是判斷到底哪些重看但不重要。
楊:另外還可以拿來做一些預測市場的事情,那這個預測市場事情有趣的是說,大多數你會想說這個網路輿情,我們之前常常跟做民調的老師一起討論。
楊:他就是說這個我們民調的單位是人,你這個聲量的單位是文章,你怎麼可以用聲量來反推比如說投票率或什麼等等,可是我做出來的結果又很準確,所以我們都一直在探究這個學理上的到底是什麼原理?
黃:對,網路聲量跟投票率直接的關係。
楊:對,因為他說如果萬一這個有的人只是只看。
黃:在網路上。
楊:他只看,他不發言,那你這樣子會算得到嗎?
黃:是,他有按讚,他也不留言也不分享,潛水。
楊:對對對對,那我們要講的是說,雖然這個他只看,他沒有按讚,他沒有發言,可是會影響到他,所以我們會去算那個影響力就是說,其實就是在算說有多少人可能會被影響。
楊:那因為這個有個假設說,大部分的人都是follower,就是會容易會被影響,所以如果網路上有留傳什麼訊息,反而很多人都去做,其實最後就會弄假成真。
黃:是,衛生紙之亂就是。
楊:或者像那個今年的事。
黃:雞蛋也是嘛,本來可能沒有缺得這麼嚴重,可能因為大家都想說我怕買不到,就買個二盒、三盒,本來可能二個禮拜、一個禮拜才吃一盒的。
楊:是,他就囤貨,這就變叫自我實現預言,今年有個例子就是在國外這個倒閉這個後來被接管的美國的矽谷銀行,它其實本來也沒有真的要倒,它只是虧損。
楊:可是這個我們同時間也有觀測一些重要的國外的推特的意見領袖,就有一個在矽谷是創投教父等級的,他就叫大家說那些新創公司說趕快把錢都領出來吧,這家可能有點問題,結果這個被retweet重複推送了好幾10萬次,結果造成最後矽谷。
黃:大家都擠兌。
楊:它1天被提領400億美金,這哪家銀行都會倒啊。
黃:本來沒有要倒的。
楊:本來沒有要倒的,這每家都會倒,所以我覺得這個其實,我們在研究AI再加上這個輿情資料,這有趣的現象就是說,我們可以利用這種螺旋或者叫自我實現的現象,反而可以預測一些有趣的情勢。
黃:是,本來輿情好像會覺得它是脫離現實世界,甚至我們會說就是有些鍵盤魔人。
楊:是。
黃:它是虛擬的,但是它是真的會影響到真實世界的。
楊:沒錯,像我們有一個研究,就是我們裡有定期用輿情跟AI在算一個用房地產的聲量,臺灣地區,然後我們就用這個房地產的聲量來預測臺灣的房地產的週期漲跌,然後再去對照內政部所放出來的這種不動產移交戶數,發現二者是高度的相關,而且這個輿情。
黃:是個怎麼樣的相關?
楊:而且對,它的相關方式,就兆徽講得好,就這個輿情是領先指標,會領先大概一季到兩季,這個輿情如果開始熱,那我們做的還會分縣市。
楊:所以它利用這個AI 的語意分析,現在語意分析真的很厲害,它會知道你讀完這個討論的時候,它是在講臺北還是在講新竹,還是在講新竹的竹北的哪個建案?哪個地區?
楊:我們就會把它分離出來來算,然後我們就會發現說在預測這些六都重要的建案,或者是重要的地區,或者一些重劃區等等的,然後來預測他們將來的這個房地產的這個成交數、成交戶數跟這個走勢的話,都可以領先一到二季,而且是真的就可以預測得出來。
黃:就是大家會在網路上討論說要去買哪裡的房子,好不好?然後它大概一、兩季以後就真的會影響他的行動決定。
楊:是沒錯,所以像現在在,我們這個產業裡面用ChatGPT還有一題就是說,剛剛跟兆徽有分享就是這個叫預測金融市場的情緒。
楊:因為我剛剛不是有說這個GPT它遍覽群書,它文學造詣非常好,所以這個它可以知道它是正面還是負面,那它可以就知道說,到底甚至是大多數的人對這個股票或期貨或原物料,是看好?還是看跌?
黃:某一家公司的。
楊:然後利用這個看法來做這個投資的判斷跟決策依據,居然也可以得到非常好的效果的。
黃:就是當大家都討論說這個很好的時候,大家就會去買,然後它就會往上。
楊:它就會供不應求,然後就會往上,對啊。
黃:可是我們之前雖然我自己是真的從來沒買股票啦,但是聽說當菜籃族都下去買的時候,這支股票就是要跌了嘛?
楊:沒錯。
黃:或是說這個整個大盤就是要跌了。
楊:所以這個,這個方法也是有它的一些侷限性,它的最大優點是快速,就是說如果這個是在未來現在這個資訊爆炸的階段。
楊:那你能夠運用駕馭AI,你可以率先看完1天六十億字到七十億字,最短時間看完,因為AI我們,我們通常這樣掃描一輪大概只要三十分鐘。
黃:一輪的意思是說?
楊:就是巡邏臺灣一輪,這些。
黃:所有的媒體,所有的網路訊息?
楊:對,所有巡邏完這樣一輪是三十分鐘,那你這樣巡邏完一輪。
黃:這樣巡邏完一輪,大概可以看到多少個帳號?
楊:帳號數倒是上千萬的帳號數,這樣全部巡過一輪,那我這樣看完之後,其實就如同剛剛兆徽所講的,如果你可以反應地比較快,其實你就會有在一個時間。
黃:一個時間差裡面。
楊:一個時間區段裡面,在經濟學裡面就你有一個套利的機會啦,就因為的確最後當全部的人都知道這件事情之後,其實你就是效率市場,你就沒辦法得到套利的機會,可是AI真的是比較快。
楊:因為我們剛剛就講說,現實社會就是有人快有人慢,那AI可以讓你的反應更快,它是生產力工具,所以現在有好多大的越是專業的團隊。
楊:它裡面真的都已經導入這種AI,這種金融機構、投資機構,他們都是用AI在做計算,那他們都是速度可能比我講得更快,不用到三十分鐘,他們可能反應得更快,所以到時候就會得到一些超額的報酬這樣。
黃:是,這個所謂的輿情啊,比如說我們還會關心的是,接下來臺灣的大選到了,這個所謂的輿情,我們要怎麼看待?
楊:好,那我們在臺灣在利用這個輿情,也一直有來看說到底可以不可以預測這個,比如說候選人當選的機率,那的確在臺灣以至於就是說,真的就有很多人,我們看到的就機器來分析的真的有很多是網軍帳號,就是說有的人。
黃:你們怎麼看這是網軍帳號?
楊:好,就是說它的這個發言的內容,我們會有透過幾個方法來判斷,用AI 來判斷,這個這邊我講一些配方,不過我如果把配方都講完,大家就會反制,對,那我今天。
黃:你增加公關操作的難度也是功德一件。
楊:沒問題,我今天儘量多講,這個第一個就是它最有可能就是上文不接下文,就是它前面前1篇講的是它是什麼剛找到工作,下一篇又它還在唸書,然後又它一下住北部、一下住南部。
黃:這個帳號的角色很混餚。
楊:很混淆,所以這是早期最第一階段,就因為它是多人共用帳號,工讀生,可是這個後來現在有了這個ChatGPT也很危險,因為這個公關。
黃:ChatGPT可以用各種角色。
楊:因為公關操作公司,他們也會為這些帳號設定一個人設,所以他們內部會有人設操作的這個指引,就說這個人設就是要接著繼續講什麼東西,然後繼續什麼。
楊:那我們還是可以根據它的發文的頻率、發文的這個時間,那有些甚至會有地點,其實還是會有個軌跡,因為這個就是一般人就是它怎麼會在密集,在這麼短時間同時間又在這邊又再那邊發文,這絕對是。
黃:這表示是共用帳號。
楊:要不然就是機器人,就是它也是程式在操作,所以我覺得從中間還是可以看到一些很異常現象,或者這個人它,我們就會看到它的交友的這個。
楊:他就是按照某一特色一直去加某些好友,一直去加,然後每天新增的人數也很異常,除非這個人是,當然也有可能誤判,就是他是一個超級的這個交際花,不然怎麼會?
黃:一天之內增加一堆好友。
楊:對啊,怎麼會一天之內超過,正常人,因為我們內部在抓,你去參加什麼研討會什麼聚會大概是一、兩百,這已經算很厲害了。
楊:你那一天可以增加到五百到一千,而且這樣一直加的喔,這個都是大有問題的,所以我們就會用這種很多的方法去揪出來。
黃:你說五百、一千是粉絲follower?
楊:不是,是它去加,它發邀請,真的有新朋友參加,真的是變成這樣,然後或者,跟您剛剛講的沒錯,就是它去follow這麼多的這些頻道啊,或者是粉絲頁,這個也是一種異常的現象。
黃:因為比如說我們在臉書粉絲頁,其實都會收到只要是社團或者是一些粉絲頁,都會收到一個一些公關公司來的訊息,說只要多少錢我記得都很便宜,就可以買多少粉絲follower。
楊:是是是是是是。
黃:就是會有這種狀況。
楊:就是有這種機器人,它也是AI 操作的,所以我剛剛講說這個就變成好像防毒軟體跟病毒一樣,這二個各自就會這個道跟魔在彼此在。
黃:道高一尺、魔高一丈,互相鬥志。
楊:比較技術。
黃:是,所以您剛剛有提到這個所謂的網軍的指標,包括他角色混淆,它每次上網的地點快速移動,像哆啦A夢一樣有任意門,還有還有呢?
楊:還有這個剛剛講說它的這個行為的頻率就異乎常人,就它這個行為就包含發文它按讚、加入粉絲頁、加入社團,那這個都覺得就是在過度極端的情況下,都還是很有可能是一個異常。
黃:還有呢?發文的內容啊?這些也會是在你們監測的範圍裡嗎?
楊:我們倒是在發文的內容裡面,我們有去分析它的發言內容,那除了剛剛裡面從內文裡面去看到它的內文不一致性。
楊:比如說它的內文一下講這個一下講那個,然後可是現在有些就是發問太極端了,它也太一致了,那這個我們也都會特別把它挑出來。
黃:什麼叫作太極端太一致?
楊:好,就比如說它只要裡面提到某些品牌,提到某些人物,它就一定必罵,然後就罵的方法就感覺好像是,現在以前可能都還是罐頭的訊息,那現在的這個生成的訊息越來越高端,因為它都用。
黃:ChatGPT生成。
楊:對,它用ChatGPT生成,那可是裡面還是會有一些,我們有點可以反推出它的咒語是什麼?就說它到底是用什麼樣的內容再去生成這些更多的內容出來。
楊:那它有可能就是為了要去捧某一個品牌,或某一個人物,或者一般講叫做搜索引擎優化,要把它提升它的流量都有可能,那這些我們都會想辦去把它特別,極端的這些把它特別的處理。
楊:那裡面的方法就是說,當它過度一般人可能它的發言不退出,一個人的人生全部都是只講某件事這也很奇怪,就是說它可能或多或少可能會講一些有的或其他的。
楊:那我就會判斷這個,它的這個發言的這個領域跟專題,就是我們裡面內部還會幫它貼標籤,機器貼,就是說如果它這個太多的也有問題,一直不動的也有問題,或者說它前後不一致的也會有問題。
黃:是,那回到選舉,選舉上面我們要注意什麼樣的輿論的聲量的問題?
楊:好,那我剛剛講的是說在機器分析上面,那其實倒是這邊,如果要給各位朋友的建議就是說,其實現在這個未來真的是真假越來越多,而且假的實在是太像真的,它的頭像照片什麼全部都是生成的,然後再加上它。
黃:對,以前還要盜用別人的照片,現在它就自己生成一個美女。
楊:對啊,現在何必盜用?你現在源源不絕的人物可以用,所以,然後而且這個人物還會生成喝咖啡啊、去逛街啊,還會在101,就是煞有其事。
黃:聽起來真的有生活。
楊:對對對對,還會養狗還會養貓,對啊,所以這些都會越來越難以判斷,所以真的其實就說回過來就是說,我們真的在判斷的時候就是說。
楊:如果是以我們這種業者,或者是研究團隊,就是說我們還是要抓有影響力的,那如果是在個人的話,就說其實還是要大家要學會判斷,警覺性要高啦,就是說隨時可能都有這種假的。
楊:像我的女兒差不多是高年級,她開始自己會上網,開始會東看西看,然後每次來跟我說爸爸我今天直播,我說你在直播什麼東西?她說我有三百個人看我,我說真得還假的。
黃:哇很厲害。
楊:對啊,然後她每天都希望可以增加這個人數,我說你不要追求這些虛華指標,就是說這裡面到底是真人還是假人,你不曉得。
黃:對,沒錯,這個但是回應到這個政府的決策,我們都說要關心輿情、關心民意、回應民意,但是當這麼多假帳號可以靠AI生成的時候,所謂的民意我們要怎麼來確認?
楊:是,沒錯,所以的確也不能完全依靠這個網路輿情這個工具,我雖然我是做這個,可是站在老師的立場,我覺得他其實充其量是個補充,或者是一個選擇方案的工具,那就如同我剛剛所講的,可是說都不管嗎?也不行,因為它有剛剛講的。
黃:它會影響到真的人。
楊:是,而且它有螺旋效應,它有自我實現,本來沒有起火的,這樣大家一直講就真的燒起來了,這個也不行,所以你第一個就是說,你還是要去觀測、要注意,因為它這個叫做listen to people's voice,要聆聽民眾的聲音,那這個聲音你不能因為真的假的你就,你不能因為有假的,你就說那真的我也都不聽了。
黃:是。
楊:只是中間就說要去判到底哪些是影響力大的?哪些,因為按照我們剛剛這樣推論就是說,只要是影響力大的,假的都有可能變真的,這個其實是一個最重要的。
黃:是,對,那所以在輿情上面呢?在選舉期間有沒有要再特別注意什麼?
楊:那就如同我剛剛所講,就是說這個如果有太多這個很多陌生的帳號來加你,其實差不多就是這個時候吧,就是有太多陌生人來加你,然後或者說這個。
楊:你不要覺得說你的文章就大家都會來按讚、愛心,你就很開心,其實坦白講這是人之常情,像我自己臉書文章寫得有得到這個按讚比較多,我也會很開心啊。
楊:然後久而久之就會有的人可能就會開始發訊息給我,可是當然我警覺性比較高,我就會覺得你發得怪怪的,或者說我還是可以看出我剛剛講一些蛛絲馬跡。
楊:那其實最重要就是說,還是都要有這個警覺,就是說你要覺得這個網路上也有很多大多數,而且在未來其實真的很多都是假的,那我們還是會回到,所以我覺得我自己在做這種資訊分析,我覺得可能我用一個詞可能叫文藝復興。
黃:什麼的文藝復興?
楊:我覺得是內容訊息的文藝復興,就是說這個因為機器的這個生產得太多,就好像這個工業革命之後,這個機器農業革命,大家都有飯吃,現在餓肚子的人很少,你隨便要吃什麼,其實坦白講應該都有得吃。
楊:可是就有一群人會覺得說要吃得更好更健康,要這個有機的要等等的,所以它我覺得會呈現二極化。
楊:反而可能這種有編輯,編過的書、有權威性認證過的資訊,我覺得可能又會再被大家所重視,是因為大家會覺得與其自己去處理這麼多雜亂的訊息,不如還是委託,其實我覺得媒體的角色會更加再帶起來的。
黃:太好了,其實我跟您也是同樣的角度在看這個問題,當網路世界真真假假的訊息越來越多,而且一堆是ChatGPT生成的時候。
黃:人們會更感謝或更需要有一個權威的新聞媒體,它願意提供我們真實的訊息,然後經過這個記者去查證,經過編輯的查證,層層把關幫我們篩選。
黃:哪些是我們真的需要的資訊,然後做好求證,這個時候這個新聞媒體反而是您剛剛提到的文藝復興時代。
楊:是是是是的,其實就像現在,為什麼現在傳播,大家會覺得與其網路上看這麼多資料,不如去聽某一個人的Podcast,或者是看某個網紅。
楊;因為至少你看得到他的人,聽到他的聲音,你會透過信任的移轉,你會相信他可能幫你篩選過後,那同樣的道理其實就是還是會,人們就是沒辦法處理,當他已經受到受不了的情況下。
黃:可能要尋找可靠的可信賴的消息來源。
楊:因為它是一個代理理論,最終你還是會透過這種代理人,你才有辦法去處理,那所以我真的覺得媒體的角色,其實對ChatGPT而言。
楊:這個反而它的日後會二極化,就是要吃速食資訊的人還是會有,這可能還是大眾,可是會有更多人會關心,真的是好的、重要的資訊是什麼?
黃:優質的訊息在哪裡?
楊:對。
黃:謝謝,謝謝楊老師今天的分享。
楊:謝謝。(校對:陳俞臻、魏君道|更新:2023/09/06)