阿里巴巴 AI 「看圖回答」 測驗擊敗微軟、臉書、特斯拉,準確率還首次超越人類!
陳宜伶
2021-08-25
看圖回答問題是人類生活及溝通的基本條件,但是對 AI 來說卻是一項高難度任務。
阿里巴巴達摩學院打造出來的 AI 語言模型 AliceMind,幾天前首度打破圖像問答(VQA)世界紀錄,答題準確率甚至超越人類基準,並且擊敗同樣有參加挑戰的微軟、FB 隊伍,象徵達摩學院的人工智慧技術邁出關鍵一步。
VQA 挑戰是什麼?
圖像問答(Visual Question Answering)挑戰的緣起,是因為國際電腦視覺與技術辨識大會 (Conference on Computer Vision and Pattern Recognition,CVPR)希望鼓勵企業攻克 AI 多模態機器學習(MultiModal Machine Learning)的難題,因此從 2015 年開辦 VQA 挑戰賽,吸引來自世界各地的網路企業、科研單位參賽。
今年的 VQA 挑戰賽和往年一樣,題庫包含了超過 25 萬張真實照片,總共有 110 萬道題目。這些題目會考驗 AI 是否能辨別圖像,比如說在一張人群的照片中算出有幾個兒童、或是在圖片中辨認出書桌上的車鑰匙,進而推測房間主人是有車的。
VQA 技術已經被廣泛導入阿里巴巴平台,像是它的 AI 客服機器人「小蜜」(Alime)就已經被淘寶、天貓商家等電商平台採用。消費者輸入問題後,AI 客服會根據商品資訊和顧客問題給出答案。
另一方面,VQA 技術不僅能運用在電商,還可用於醫學圖像辨識,以及電動車的智慧駕駛分析。
阿里巴巴的 AI 模型為何成績能夠超越人類?
這幾年人工智慧(AI)逐漸滲透到各行業,也推動更多科技革命,AI 技術逐漸成為企業數位轉型、對抗疫情,並讓經濟重返正軌的重要力量。
由阿里巴巴達摩學院打造的 AI 深度語言模型系統 AliceMind 在這次的 VQA 測驗中,答題準確率拿到 81.26%,首次超越了人類答題的準確率 80.83% ,更讓馬雲投資的達摩學院在 AI 發展上取得重大進展。
AliceMind 採用了多種專有技術,包括多樣化的視覺表示(diverse visual representations)、「多模態」預訓練語言模型(multimodal pretrained language models)、「跨模態」語義融合和對齊技術( adaptive cross-modal semantic fusion and alignment technology)。這些技術不僅可以讓阿里巴巴的 AI 理解問題並分析圖像,還可以讓 AI 用近似人類的語感回答問題。
阿里巴巴達摩院自然語言處理(NLP)負責人 Si Luo 表示:「這代表我們在『機器學習』領域又取得了一個重要里程碑,AliceMind 在視覺與文本的『多模態』理解及推理上,測試分數媲美人類認知水準,彰顯了我們研發 AI 的努力成效。」
打造出這款 AI 模型的達摩學院是什麼來歷?
2017 年,馬雲認為阿里巴巴應該要把眼光放遠,致力解決未來世界經濟、社會等問題,在此願景下成立了研究單位「達摩學院」( DAMO Academy),號稱要在 3 年投入超過 1000 億人民幣,將重點放在基礎科學和顛覆式技術創新研究上。
Si Luo 表示,人工智慧分為運算智慧、感知智慧、認知智慧及創造智慧 4 個層次。這次 AliceMind 參與的 VQA 測試內容屬於認知智慧部份。
負責人也補充說,這不代表有一天我們會被機器人取代,反而這些智慧機器可以用來輔助我們的日常工作和生活,因此人們可以很專注在他們擅長的創作上。
資料來源:https://buzzorange.com/techorange/2021/08/25/vqa-ai-alibaba/
alignment醫學 在 BioMed Talent Training 生醫人才培育計畫 Facebook 的最佳貼文
2020 Q1全球數位醫療獲投金額前十五大的公司,FINDIT文中有詳細介紹:
1. ClassPass (健身服務 $2.85M Series E)
2. Alto Pharmacy (數位藥局 $2.5M Series D)
3. Karius (液體活檢 $1.65M Series B)
4. KRY (遠距醫療 $1.56M Series C)
5. Concerto HealthAI (AI腫瘤藥物開發 $1.5M Series B)
6. Element Science (穿戴式心臟除顫器 $1.456M Series C)
7. Zhangshang Tangyi (糖尿病管理服務 $1.44M Series D)
8. Alignment Healthcare (長者醫療服務 $1.35M Series C)
9. Iora Health (長者醫療服務 $1.26M Series F)
10. CureFit (健康健身管理 $1.1M Series D)
11.Verana Health (醫學臨床資料庫$1M Series D)
12. Renovo Health (美國醫療材料購買及委託開發平台$1M PE)
13.Tempus (AI精準醫療$1M Series G)
14. Virta Health (遠距糖尿病監控 $0.93M Series C)
15. Hinge Health (遠距物理治療監測 $0.9M Series C)
alignment醫學 在 湯士萱物理治療師 Suzanne Tang Physiotherapist Facebook 的最佳貼文
Kinetic Control 要在台北以中文開課囉!
熱騰騰的報名簡章出爐~ 明天10/3 8:00 開放報名!
http://bao-ming.com/eb/www/activity_content.php?activitysn=2678
這次和 舜復脊足健康醫學 合作,於2017/11/18-19 ,
舉辦 Kinetic Control Modular - Level 1-Solutions for Movement Impairments of The Low Back and Hip
以下為主辦單位特別提醒:
1名額限制為20人,線上報名成功後請盡速完成繳費才算完成報名 (三天內未繳費自動失效)
2 報名時需要用到的資料如下(建議團報的主要聯絡人先行向團報夥伴們蒐集下列資訊)
■中文姓名
■英文姓名(與護照同,發證書用)
■身分證字號
■出生日期
■手機
■Email
■銀行帳號/ 郵局帳號 (遇不可抗拒因素須停班時退款用),須包含<銀行/郵局名稱;分行名稱;戶名;帳號>
■飲食葷素
各位~課堂上見囉!
------------------------------------------------------------------------------------------
若還不清楚,再次向各位介紹 Kinetic Control 的課程架構 :
Kinetic Control 是由英國 Movement Performance Solution 公司所研發的系列課程
Kinetic Control 課程分為兩大系統:
■「The Movement Solution 課程系統」
■「Modular(模組) 課程系統」
■The Movement Solution 課程系統:
The Movement Solution 1: 15天(含翻譯時間)
The Movement Solution 2: 6天(含翻譯時間)
The Movement Solution 3: 6天(含翻譯時間)
目前台灣 The Movement Solution 課程由物理治療學會承辦,邀請 Mark 老師授課。
■Modular (模組) 課程系統: 將 The Movement Solution 課程系統拆成好幾個兩天的課程。大致上來說:Level 1 + Level 2 = The Movement Solution 1。
Level 1: 2天 X3
Level 2: 2天 X3
Level 3: 2天 X9
我將以中文(/英文)在台灣、香港、澳門、中國...等各地教授 Kinetic Control Modular (模組) 課程。
這邊是 Modular 課程詳細的介紹,歡迎參考 http://www.kineticcontrol.com/education/modular-2016
Modular Level 1 課程包括:
1.Solutions for Movement Impairments of The Low Back and Hip
2.Solutions for Movement Impairments of The Neck and Shoulder
3.Movement, Alignment & Coordination
------------------------------------------------------------------------------------------
#KineticControlModularCourse
#認真的物理治療師
#KineticControlTaiwan