DeepMind AI 修練成精了,已經學會「發脾氣」?
作者 雷鋒網 | 發布日期 2021 年 08 月 12 日 8:00 |
DeepMind 又在「捏小人」了!這群小人是英國人工智慧實驗室 DeepMind 生產的 AI,不過只能在遊戲裡看到。但你可能不知道的是,DeepMind 還訓練過 AI 下象棋、玩足球、比電競,甚至提出人工生命言論。
最近這群AI,竟然能直接跳過數據訓練,在開放式任務環境自我進化。
之前Alpha Go和Alpha Star能力再強,也只能在各自擅長遊戲放大招,超出範圍立刻停擺。現在這批小人卻能在不同遊戲游刃有餘完成任務,展現超強的泛用能力。難道人工智慧治好泛用「頑疾」了?
在搶奪高地金字塔的任務,兩個不同顏色的小人能力值相當,都沒有跳躍能力,開始發脾氣亂扔東西,混亂中竟把其中一塊板子「扔」成樓梯,長驅直入,任務完成!
多次實驗發現,小人可複製方法,難道這群AI有記憶了?不僅如此,小人還學會「相對運動」──我上不去,你下來──借助板子直接把目標拉下來!甚至為了贏得比賽,多個小人學會配合,團體合作能力一直上升。
這種用虛擬遊戲自我進化的AI,僅需人為搭建任務環境,設計大量任務目標,利用加強深度學習,一步步打通關,最終成為十八般武藝精通的AI。
沒有樣本,沒有經驗,這些AI究竟如何進化,零樣本學習是否意味這些AI具備基本的「自學意識」?
社會達爾文主義訓練場
比起之前的足球場,這批AI的訓練場更像遊戲「社會」,有無數個遊戲房,每房間遊戲照競爭性、平衡性、可選性、探索難度分類。不管哪種任務,這批AI都只能從最簡單開始,一步步解鎖更複雜的遊戲,整個遊戲更像虛擬社會。
無需大數據集訓的AI,每玩一次遊戲就成長一次,與各種環境互動和「獎勵」下成長為更通用的AI,更像人工「生命」。
能讓AI自我進化的關鍵在於正確設計初始智慧和進化規則。一開始都非常簡單,所有複雜結構都是進化而來。就像嬰兒不會做大人的事,任務核心是不要超出AI自身的改進能力。
據DeepMind說法,每個AI會在4千間遊戲房玩約70萬個遊戲,並在340萬個任務經歷2千億次訓練步驟。1億次步驟約耗時30分鐘。照這訓練法,41天就能訓練出一群「成年」AI。
但AI還是不會思考
DeepMind表示「單AI可開發智慧成多目標,不僅一個目標」。AI公司Pathmind 的CEO Chris Nicholson也說「它學到的技能可舉一反三。例AI學習抓取和操縱物體,就能完成敲鎚子或鋪床任務。DeepMind正用程式設計為AI在這世界設定目標,這些AI正在學習如何掌握。」
但南加州大學計算機科學副教授Sathyanaraya Raghavachary表示,這些AI並不能定義為「生命」,尤其關於AI擁有身體感覺、時間意識及理解目標幾個結論。「即使人類也沒有完全意識到身體這件事,更不用說人工智慧了。」
他表示,活躍的身體對大腦不可或缺,大腦要放在合適的身體意識和空間位置內進化。如果AI能理解任務,何必需要2千億次模擬訓練達到最佳結果?總體而言,虛擬環境訓練的AI只是和以往AI「大同小異」。
從理論到現實的路還很長
狹義人工智慧是「複製人類行為的元素」,在計算機內執行某種任務,如分類圖像、定位照片物件、定義對象邊界等。這些系統旨在執行特定任務,而不具解決問題的一般能力。
相比之下,Deepmind使用的「通用人工智慧」有時也稱為人類等級人工智慧,因可理解上下文、潛台詞和社會線索,甚至認為可能完全超過人類。
但正如行為主義和認知主義的對抗,AI是否有解決問題的能力,並不能只考慮統計結果。善於「事後解釋」任何行為,實驗室之外還是無法「預測」哪些行動即將發生。
資料來源:https://technews.tw/2021/08/12/is-deepminds-new-reinforcement-learning-system-a-step-toward-general-ai/?fbclid=IwAR0xofCay9Ydy83BfQ_7lyEtfGvJroFfCznxiTxYIHP6HUFWpELClQPFs28
同時也有2部Youtube影片,追蹤數超過18萬的網紅阿畫,也在其Youtube影片中提到,如何運用心理技巧 讓他對妳喜歡成癮? #兩性 #心理學 #間歇性強化 喜歡別忘了訂閱、分享及開啟小鈴鐺哦。 🔸【阿畫第二頻道】日常廢片 https://reurl.cc/5qkMOv 🔸【阿畫】粉絲團 https://bit.ly/2pRPiiE 🔸【阿畫】Instagram https://bit...
行為主義 實驗 在 偽學術 Facebook 的精選貼文
【東奧2020】#為什麼我一看比賽就掉分啦~ | 鴿子的迷信 // 🕊
.
#戴資穎戴資穎第一名~ 大家是不是正在為了各種賽事超級緊張,然後覺得,「為甚麼我一看電視就掉分數啦~」,觀賽群眾時常會有一種不敢看的感覺,「一定是因為自己介入了,所以才改變了比賽的結果」。一邊看球賽,我們奧運科普一下。其實,這是一種「#鴿子的迷信」(superstition in the Pigeons)。
.
▓ #箱子裡的鴿子
.
行為主義心理學家史金納(B. F. Skinner),在1948年時做了一個實驗。史金納把鴿子放進一個箱箱中,每間隔十五秒就掉一顆食物,鴿子就會很開心的吃掉這顆食物,之後再過十五秒又掉一顆,不斷重複。
.
所以掉食物這件事,其實跟鴿子的行為完全無關,但「#操作制約」(operant conditioning)會讓鴿子把「#行為」和「#結果」關聯起來,就是鴿子就會亂連結。於是,鴿子會自己在箱子裡,重複做出自己覺得與食物相關的行為,牠深深相信這樣就會有東西可以吃了。
.
▓ #我不敢看比賽啦會掉分
.
「用念力」、「關電視」、「吃雞排(?)」等乞求勝利的行為,只要多幾次相關的機率,我們就會把自己想要與不想要的因果關係連結起來。像是「打麻將要穿紅內褲」一樣,產生一種類似迷信的歸因謬誤行為。
.
其實,這樣也沒甚麼不對。人本來就會積極地追求事物的因果關係,以試圖辨明混沌不明的無序,形成可以預測、掌握秩序。是還蠻自然的行為啦~
.
重點是,戴資穎戴資穎第一名~ 然後等等拜託要 #聖杯~ (雞排準備)
|
#參考文獻:
.
Skinner, B. F. (1948). 'Superstition'in the pigeon. Journal of experimental psychology, 38(2), 168.
行為主義 實驗 在 鏡好聽 Facebook 的最讚貼文
#你今天制約了嗎 #放開那隻可愛狗狗!
無心插柳柳成汁(才沒有)研究狗狗流口水也能拿到諾貝爾獎!你聽過「帕夫洛夫的狗」嗎?
在這一集《大腦好好玩》,主持人謝伯讓將跟大家分享,這群狗狗是如何大大影響科學界的進展,帕夫洛夫又是怎麼意外發現這個現象?
究竟這顆狗狗震撼彈(我是說制約學習理論)通常會有哪幾個階段?在現象當中,又有哪些值得關注的概念呢?
現在就來收聽:《#大腦好好玩》
EP10|科學史上最出名的狗:行為主義學家帕夫洛夫與制約學習 ► https://pse.is/3es3ad
行為主義 實驗 在 阿畫 Youtube 的最讚貼文
如何運用心理技巧
讓他對妳喜歡成癮?
#兩性 #心理學 #間歇性強化
喜歡別忘了訂閱、分享及開啟小鈴鐺哦。
🔸【阿畫第二頻道】日常廢片 https://reurl.cc/5qkMOv
🔸【阿畫】粉絲團 https://bit.ly/2pRPiiE
🔸【阿畫】Instagram https://bit.ly/2xcsNsM
▼阿畫的人氣影片▼
運用巴納姆效應!快速讓對方卸下心防!?
http://bit.ly/2JhrYFB
初次約會必學攻略!靠「這招」好感度立馬爆增
https://bit.ly/2tUxuoV
比欲擒故縱更可怕的制約學!?必學的關係制約
https://bit.ly/2IWfWTx
約會必學讀心術!揭開肢體語言的秘密
https://bit.ly/2THNGsk
教你如何聊天!把心聊走!?必學「讀心三大招」
https://bit.ly/2NQACeD
👍必看的阿畫熱門十二星座攻略
https://bit.ly/2QpTn8e
樂曲提供:Production Music by http://www.epidemicsound.com
阿畫 關鍵字:
兩性 愛情 戀愛 感情 星座 曖昧 男女 心理學
行為主義 實驗 在 啟點文化 Youtube 的最讚貼文
【線上課程】《人際斷捨離》~
安裝心靈防毒軟體,提升自己的「人際免疫力」!
課程連結:https://pse.is/E5MW5
第一講免費試聽:https://youtu.be/YyLvd1cNcDw
【人際維基】桌遊體驗會~讓你一玩就懂別人的在乎~05/04(六)或 06/16(日)14:00
活動資訊課程:https://www.koob.com.tw/contents/3072
【哈克工作坊】~讓你的存在,成為別人想親近的禮物~06/29(六) & 06/30(日)
課程資訊:https://www.koob.com.tw/contents/3897
[ 7/21 開課!]【寫作小學堂】~寫出專屬風格,找回文字悸動
打造一盞自己的聚光燈,建立起專屬於你的品牌印象
課程資訊:https://www.koob.com.tw/contents/3655
【08/10開課!】《人際回應力-看懂情緒,輕鬆對談》~第20期
一個人的命運,是回應力的總和!
課程資訊:http://www.koob.com.tw/contents/157
更多學員心得分享:http://goo.gl/Guc6V6
【線上課程】《時間駕訓班》~
學會提升效率,擺脫瞎忙人生,做自己時間的主人
課程連結:https://pse.is/DDDHB
第一講免費試聽:https://youtu.be/flfm52T6lE8
線上課程【不用開口,就讓你擁有人際好感】
啟動人際溝通的關鍵影響力 https://goo.gl/v3ojdo
桌遊【人際維基】~一玩就懂得別人的在乎:https://goo.gl/Ej4hjQ
到蝦皮購買【人際維基】:https://goo.gl/ASruqR
=============================
本書的實驗,定義了心理學的研究範疇
透視19世紀以來的偉大科學家
如何透過巧妙的實驗設計,破解人類的意識之謎
並逐步建構出今天心理學的龐大體系
這本書,獻給每一位對心理學有興趣的朋友