AI 如何為公司創造更多價值?專家:2 個缺陷,要先由人類來修補
2021/05/13
採訪‧撰文
盧廷羲
張凱崴
美國人工智慧國家安全委員會(NSCAI)今年 4 月建議,國防部每年應至少分配 3.4% 的預算投入科技領域,並提撥 80 億美元研發 AI。企業方面,微軟(Microsoft)4 月宣布,將以 197 億美元收購語音辨識開發商紐安斯通訊(Nuance Communications);後者是雲端與 AI 軟體的先驅。
從企業到國家,都愈來愈重視人工智慧,知道要想辦法運用 AI 創造更好的生活。不過,目前 AI 發展到底處於什麼階段?我們又該如何應用?
美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授張凱崴形容,目前人工智慧技術已經可以幫助人類完成很多事,像是疫情來襲,電腦可以從大數據中篩選條件,自動搜尋、判讀潛在病例,幫助醫生大幅減少檢查時間,但 AI 也並非萬能,要先認知它的局限。他研究如何讓 AI 更符合人性,獲得 2021 年的史隆研究獎(Sloan Research Fellowships)。
AI 局限1. 資料寬廣度不足時,就會複製人類偏見
張凱崴認為,電腦在學習的時候,是依賴「彙整數據資料」來判斷,並沒有真正思考,如果資料來源太狹隘、不夠多元,資料寬廣度不足,電腦判斷就會出現偏差,「你跟電腦講清楚 input(輸入)、output(輸出),提供足夠的數據資料,它可以對應、學得很好,但還有很多面向 AI 做不到。」
舉例來說,亞馬遜(Amazon)2014 年推出智慧音箱(Amazon Echo),使用者口頭下指令給語音助理 Alexa 就能放音樂、查資訊。然而,有些人口音較罕見,或是用字較特殊,智慧音箱的資料庫沒有「不同口音」「不同用詞」的檔案,就可能失靈,這是當前 AI 的其中一大問題。
張凱崴進一步解釋,AI 另一項挑戰是,它無法清楚分辨「不曾出現」與「不能出現」(無法出現)之間的區別,只是從資料統計出要學的東西,無法像人類一樣進行邏輯思辨。
AI 的運作方式,第一步是輸入資料,第二步是分析,但這過程容易出現偏見。例如電腦在理解「總統」這個字,會去看四周有什麼字詞,來學習總統這個詞,由於許多總統都是男性,電腦就會「覺得」總統是男性。
這也是為什麼,如果讓 AI 學習,在它的認知裡,女性「不可能」當美國總統(因為沒有資料紀錄)。「你可以跟人類說,任何職業、性別都是平等的,但對電腦來講,這很困難,」張凱崴說明,一旦資料的寬廣度受限,電腦就容易產生偏見。
就像在自然語言處理(Natural Language Processing,讓電腦把輸入的語言變成有意義的符號)領域,張凱崴說明,AI需要知道代名詞指的是「哪個名詞」,才能運算下去。但如果資料受限,使用男性的「他」,電腦可能判斷這個代名詞是指總統、總理、執行長;但換成女性的「她」,由於數據不足,電腦就會混亂,出現系統性誤差。
他再舉一例,美國人工智慧研究組織 OpenAI 提出「生成式預先訓練」系統(GPT,Generative Pre-training),推出到 GPT3 版本,屬於書寫類 AI,電腦能夠揣測人們說完上一句話,下一句可能會講的句子,自動完成後半段。
好比有人上一句寫下「我正在和教授聊天」,系統可能推導出「我們在研究室討論學術問題」,因為電腦藉由蒐集來的語料資料中判讀出「教授」和「學術」具高度相關。但研究也顯示,GPT2(前一代版本)系統也從資料中學習到許多偏見,像是如果句子前半談論白人男性,系統傾向產生正面評價;如果句子前半是黑人女性,系統竟會產生負面句子。對企業來說,許多組織接觸 AI,想讓它們取代部分工作,首先需要留意資料的廣度、多元性,才能減少電腦犯錯的機會。
AI 局限2. 即便條件相同,也無法每次都做出正確判斷
「其實,現在的 AI 就像一台原型飛機,還缺乏穩定性。」張凱崴說,現行的 AI 就好比萊特兄弟(Wright brothers)剛發明飛機,看似可以做很多有趣的事,但「可以飛」跟「飛得很好」,有一大段落差。
紐西蘭的簽證系統曾鬧出笑話。人們上傳簽證照片,AI 掃描後,確認是不是本人,但當時系統沒有估算到某些亞洲人眼睛比較小,一名亞裔男子被判定「沒有張開眼睛」,因此照片無效。
張凱崴說,在這個例子中,凸顯出 AI 的穩定性不足,「系統沒有考慮到不同人種的差異,很死板地認為你眼睛沒張開。」所謂的缺乏穩定性,指的是 AI 沒辦法在相同條件下,每次都做出正確決策,這也是使用 AI 時,須留意的第二個挑戰。
他再舉例,許多模型可以準確分析,一則影評對電影的評價是正面或負面。然而研究顯示,有時只要將影評中一些字換成同義詞,例如把電影(movie)換成影片(film),或改寫句子,即使意思並未改變,系統卻把原本判斷為正面的影評標註成負面。這顯示AI系統還未真正了解語言的含義。
在設計這些程式時,人們必須注意到 AI 可能有局限,設定的資料範圍要更完整,考慮這些因素,就能減少偏見、落差,進而加強穩定性。
餵指令給 AI 要多元化,嘗試「換句話說」、刻意混淆
經理人雖然不一定具備 AI 方面的專業知識,但只要掌握觀念,再透過 AI 領域專才協助,也能優化系統。張凱崴指出,最直接的方法是,設計 AI 模型時,要把來源群組不同的資料分門別類測試,在測試階段讓群體多元化,並確保不同特色的使用者,用起來都沒有問題。
舉例來說,一套 A 系統擁有來自各地的使用者,如果設計者是台北人,設計系統的思維容易以台北生活為主,很可能因為當地習慣不同,導致花蓮使用者操作不順。
另一個方法,則是用不同的「語意」,去測試 AI 有沒有徹底學會一個概念。例如,有一套餐廳評鑑的 AI 系統,只要蒐集、整理使用者意見,就能判斷每個顧客對於餐廳的評比是高分或低分。那麼要如何確認這套系統的穩定性?張凱崴建議,可以利用「抽換詞面」的方法。
比如,把詞彙換成同義字,再看 AI 是否能運算出相同結果,「你可能會發現,原本評比結果是食物很美味,但如果美味換成比較困難的詞,AI 就會分不出這則評比是好是壞。」因此在訓練模型時,可以將詞彙隨機抽換成同義詞,增加 AI 的詞彙量。
第三種方式更進階:改變句型、重寫句子。張凱崴指出,同樣一句話,如果換成不同說法,電腦可能判讀錯誤,將「因為發生 A 事件,所以導致 B 事件」,改寫成「B 事件發生了,是因為 A 事件的緣故」,明明兩句話意思一樣,但 AI 很可能因為穩定性不足,搞混兩者的差別。如果要鞏固 AI 的穩定性,可以使用自動改寫的方式,增加資料的多樣性。
張凱崴表示,經過這些測試,讓 AI 接受更多元化的訓練,得到更廣的學習範圍,往後碰到同義詞、相似資訊,才能有效判讀。
張凱崴總結,AI 還在快速發展,或許可以創造更多工作機會、新的職位,但現行階段,它只是輔助角色。AI 並非魔術盒子,使用它就一定有更好結果,人們還是要保持高度耐心,先認識它的缺陷,才能在技術更迭下,發揮出最好的結果。
張凱崴
台灣大學資訊工程系碩士、美國伊利諾大學(UIUC)電腦科學博士。美國加州大學洛杉磯分校(UCLA)電腦科學系助理教授,研究領域包括人工智慧、機器學習、自然語言處理。2021 年獲得史隆研究獎(Sloan Research Fellowship),研究團隊開發的運算方法,使人類語言處理的程序更有效率、更多元,同時兼具公平性。
附圖:優化AI系統的3方法
資料來源:https://www.managertoday.com.tw/articles/view/62902?fbclid=IwAR2jI1bhg1anqct0AZZR_3LKKJqIsvG0wz2whSN8iniROZApHt-_qpD7dis
「系統性誤差」的推薦目錄:
- 關於系統性誤差 在 台灣物聯網實驗室 IOT Labs Facebook 的最佳貼文
- 關於系統性誤差 在 姚松炎 Edward Yiu Facebook 的最佳貼文
- 關於系統性誤差 在 姚松炎 Edward Yiu Facebook 的最佳貼文
- 關於系統性誤差 在 邱博文物理實驗(0-8):數據處理(8)誤差的種類 - YouTube 的評價
- 關於系統性誤差 在 系統誤差定義的評價費用和推薦,EDU.TW、DCARD和網紅們 ... 的評價
- 關於系統性誤差 在 隨機誤差系統誤差在PTT/Dcard完整相關資訊 - 諸葛亮 的評價
- 關於系統性誤差 在 隨機誤差系統誤差在PTT/Dcard完整相關資訊 - 諸葛亮 的評價
- 關於系統性誤差 在 [學習分享] 星期四流病夜,偏差:談Berkson bias ... - Facebook 的評價
- 關於系統性誤差 在 系統誤差計算在PTT/Dcard完整相關資訊 - 小文青生活 的評價
- 關於系統性誤差 在 系統誤差計算在PTT/Dcard完整相關資訊 - 小文青生活 的評價
系統性誤差 在 姚松炎 Edward Yiu Facebook 的最佳貼文
【#基建超支.無日無之】立法會「又」審議超支工程,今天工務小組委員會審議 #南港島線 超支撥款申請。
今次南港島線超支,港鐵推說是低估了工程難度,工程進行時才發現地下出現大量孤石群。但「賴地硬」這個原因多次在立法會申請撥款時出現,而且一般的工程估算,已預留應急款額,應付不可預知的超支。
正如我早前的 #香港大型公共工程超支問題 研究統計,單單計算預算超過十億的工程,過去四屆財委會我們有21個超支撥款申請,涉及款額超過611.377億,平均超出31%,而且是 #百分之百通過 !
不少工程都出現先低估,後超支,然後上來立法會申請撥款,予取予攜,可見已經出現「系統性誤差」。
政府推說這是印象問題,因為不少工程就是超支才上來立法會申請撥款;而運房局又提出,何文田站出現同類情況都無超支,自鳴得意。我要求政府提交統計數字,有多少工程高估和低估難度。
但我覺得更重要的,是政府應提出辦法,解決經常大幅低估工程預算問題,否則每次都以「洗濕個頭」為由而強迫立法會通過撥款,那麼立法會審議工作還有甚麼用?其實我早前發布「香港大型公共工程超支問題」研究,裹面有提出解決辦法,大家可參考一下:https://goo.gl/TxhG6X
#片尾有彩蛋
#每次洗凸都攤大手板嚟攞錢
------
👨🏾💻延伸閱讀:
1.《基建超支元兇──國際如何解決「樂觀偏見」與「不實陳述」?》|姚松炎、馮蘊妍|端傳媒 2017-04-02
https://theinitium.com/article/20170402-opinion-edwardyiu-infrastructure/
2.「香港大型公共工程超支問題」研究發佈 | 2017-03-30
下載報告全文: https://goo.gl/TxhG6X
記者會: https://www.facebook.com/Dr.EdwardYiu/videos/vb.231691230538734/407509879623534/?type=2&theater
新聞稿: https://goo.gl/qOSQpC
3. 用三分鐘睇吓基建超支現況 | Smart Governance Lab
https://www.facebook.com/smart.governance.lab/videos/vb.352418138487206/359287964466890/?type=2&theater
-------
👁了解姚松炎議員的工作:https://www.edwardyiu.org/
📪訂閱姚松炎議員辦事處最新資訊:https://goo.gl/lTe860
📈📊💻起動公民社會,透過整合和提供各項公共資訊,加強市民對社會議題的理解及掌握,Smart Governance lab: https://www.facebook.com/smart.governance.lab/
系統性誤差 在 姚松炎 Edward Yiu Facebook 的最佳貼文
【#基建超支】近年,香港政府的多項大型基建工程相繼超支,而且超支比例甚高,已經引起各界關注。
不講不知,很多以通脹或地質狀況作為大量工程超支的解釋都不太合理。因為所有工程預算都已經包括了一項價格調整因子,及一項應急支出預算。換言之,只要通脹率變化有高有低,地質等因素時難時易,這兩項預算理應平均處理好相關的不確定性,即不至於出現系統性誤差以致一律超支現象。
政府經常以「洗濕咗個頭」(已經花了不少支出,叫停將會造成大量浪費)為由,總是脅迫議員繼續撥款,變成無底深潭,無法抽身。
其實,外國政府不少應對基建工程估算錯誤的措施很值得香港參考。我的助理馮蘊妍撰寫了一份報告:https://goo.gl/TxhG6X,詳細羅列有關資料,大家可以參考,給予意見。
https://theinitium.com/…/20170402-opinion-edwardyiu-infras…/
工程超支研究發佈記招新聞稿:https://goo.gl/qOSQpC
----
了解姚松炎議員的工作:https://www.edwardyiu.org/
訂閱姚松炎議員辦事處最新資訊:https://goo.gl/lTe860
系統性誤差 在 隨機誤差系統誤差在PTT/Dcard完整相關資訊 - 諸葛亮 的推薦與評價
Random Error - 隨機誤差- 國家教育研究院雙語詞彙一般測量時都將誤差分為二類,一為系統性誤差(systematic error);另一為隨機... 而所謂隨機誤差係指測量時出現的 ... ... <看更多>
系統性誤差 在 隨機誤差系統誤差在PTT/Dcard完整相關資訊 - 諸葛亮 的推薦與評價
Random Error - 隨機誤差- 國家教育研究院雙語詞彙一般測量時都將誤差分為二類,一為系統性誤差(systematic error);另一為隨機... 而所謂隨機誤差係指測量時出現的 ... ... <看更多>
系統性誤差 在 邱博文物理實驗(0-8):數據處理(8)誤差的種類 - YouTube 的推薦與評價
a. 系統誤差 (systematic errors):此種 誤差 的特徵是所有的測量值都比真值偏大或偏小。這類型的 誤差 可分為儀器 誤差 (instrumental errors)因為儀器校正 ... ... <看更多>