每次一不留神,新的書就一直疊上來不及消化的書堆裡,大概是之前被七月選書《樹冠上》消耗過多精氣神(https://bit.ly/3j22BJr),而這排約莫落在七月中到八月中入手的書籍,先稍微做個紀錄,因為下個月的書單相當豪華,類型遍及電影、音樂、系列小說等等,大概需要先把額度留下來,九月真的非常值得期待。
⠀⠀⠀⠀⠀
這個月的選書並沒有特別獨立出來分享,因為是新版重出,這本在我多年前首度讀到的時候就頗為喜愛,為蕭麗紅的代表作《#千江有水千江月》,而此次恰好是四十周年紀念版本,希望能好好地為這本書寫篇文章。故事以布袋的蕭姓大家族為中心,敘述傳統大家庭的習俗和人情瑣碎,並探討生死、親情、愛情的衝突與矛盾。生於世代養殖漁業維生的大家庭,主角貞觀巧遇表哥大信,開始了一場若有似無的愛戀。這段戀情直到貞觀上臺北工作,大信到金門當兵,兩人間的情愫也因誤解而產生令人唏噓的變化。在蕭麗紅的內容敘述中,充滿了臺灣民俗的瑰麗與趣味,而貞觀與大信古典又含蓄的戀情,為臺灣逐漸失去的純然戀歌,悠悠地低吟了一遍。
⠀⠀⠀⠀⠀
接下來是掛名推薦的兩本,一本為早已提過多次,正在進行贈書活動的馬修麥康納回憶錄《#綠燈》,50 歲的他,花了 42 年的時間釐清自己生命中的謎題,35 年的時間記錄下解答的線索,他想要知道如何當個好人,如何得到想要的東西。如何使生命得到意義,如何更成就自我。他寫下日記,記錄他的成功與悲傷,理解與回憶。他說他書寫,是為了遺忘。敘述該如何在充斥「不」的世界中得到更多「好」,以及如何認出可能是「不」的「好」,關於抓住綠燈、並理解人生中的黃燈與紅燈遲早會轉綠的書。
⠀⠀⠀⠀⠀
再者,也已提前分享過的電影《#火口的二人》白石一文原著小說,故事敘述十天後將舉行婚禮的直子回到家鄉福岡,來到昔日戀人賢治面前。多年後再重逢,沒有一聲問候,也沒有一句質問,只是如昨日才剛分別一般,平淡中透著一股熟悉地拉開序幕。在二人熟悉的老家中,直子翻起一本舊相簿,裡頭盡是她與賢治一絲不掛的黑白性愛照。一頁一頁,往事的物證翩然眼前,那張如回憶之鑰的富士山火山口海報也隨之乍現,直子不禁脫口說出:「我最喜歡這張照片了。」二人之間曾不顧一切燃燒的火焰,在即將被宣判死刑的愛情面前再度復甦。等待直子未婚夫歸來的倒數五天,二人似末日到來般無法無天的徹夜歡合,如乾柴烈火覆水難收。肉體的歡愉、禁忌的血緣、沒有未來的放肆,在愛情與生命都將終結之前,二人最後看見的風景,名叫 —— 活著。
⠀⠀⠀⠀⠀
另一本為曾寶儀《#一期一會的生命禮物》,透過她真實經歷的四段旅程,在阿姆斯特丹,見到第一位合法執行安樂死的醫生,他說死亡為什麼不能是一場盛宴?在瑞士,和 104 歲的人瑞擁抱,她開始不斷與七年前的自己對話在洛杉磯,見到「Hamony」,世界第一具 AI 人工智能性愛機器人。在美墨邊界,很多人看見了暴力,分離,界線,隔離,但對這裡也有愛,勇氣和希望。在聖地牙哥,一場「長生不老大會」激情展開,那是令人完全無法想像的未來世界。這本書希望是一趟思考的旅程,更靠近真實自我的旅程,直視生命的旅程,以及全然自由的旅程,當旅程結束,你也有了一份屬於自己一期一會的生命禮物。
⠀⠀⠀⠀⠀
此次先介紹三本華文作品,若要選一部個人最喜愛的本土劇集,無疑是現在正在播出第二季的《俗女養成記》,而原作者江鵝也推出了另一本散文集《#俗女日常》,有別於上一本以在傳統中藥店家庭養成的台南女兒故事為主軸,最新文集不改幽默詼諧本色,卻更多聚焦於成長後在台北打拚的都會熟女人生。江鵝曾在訪談中表示,她跟「陳嘉玲」最大的共同點,是中年對生活各面向的反思,還有勇敢離開職場,做一個普通女人。這本《俗女日常》,也可說是這位勇敢的「普通女人」醒悟後學著做自己的第一手實驗記錄。回到俗女的日常,說普通也不普通,玲瓏通透的智慧和文采,清爽的文字挾帶著不可言說的魔力,既療癒又提點,不只讓同世代的六年級女生心有戚戚,五至七年級的都會女子讀來應該也都會覺得毫不高深,卻又如獲天啟。
⠀⠀⠀⠀⠀
其次為,胡晴舫主編的《#我臺北我街道》,集合不同世代、不同背景的二十位作家的全新創作,他們各自以詩、散文、小說書寫記憶中的台北街道。小說與詩提煉出意象,散文貼近個人記憶與生活,不同文體、長度產生不同的閱讀效果,就像散步每一條街道感受到各自獨特的氛圍。焦元溥寫消失的羅斯福路唱片行,馬世芳寫來不及參與的麥田咖啡館,張亦絢寫她的木柵路,崔舜華寫她的潮州街,吳鈞堯寫他的重慶南路,何致和寫永遠在他心底流動的西藏路,馬欣寫敦化南路的前世今生,王盛弘、羅毓嘉在這座城市私藏了他們的男孩記憶,郝譽翔在椰林大道度過了她的憂傷青春,以曲折方式學會在台北安置自己的馬翊航、王聰威,更有陸穎魚在台北街頭思念香港,顏訥在往生者帶領下探索她不知道的台北,陳雨航在文章不斷叩問,自己是否是台北人?而被言淑夏形容為春天繼母的台北街道,也有楊佳嫻的 236 公車呼嘯而過,裡頭住有陳宛茜認識的清朝耆老、陳又津描寫的公娼,以及駱以軍眼中身懷內力的各路高人。除了作家視角,更有來自法國的攝影師余白,用鏡頭拍攝他安身立命這麼久了的第二個家。閱讀他們的台北,讓我們更深刻了解這座城市。
⠀⠀⠀⠀⠀
第三本是兼具編劇與作家身分的劉梓潔新書《#希望你也在這裡》,她以這部小說,揭開路上的迷人和迷惘,熱鬧和寂寞。對生命的種種疑問,也許那些錯身而過的風景就是解答。有些人是天生的流浪者,有些人在飽嘗人的來去後才終於能夠出發,也有的人不知道前方有什麼,卻越走越寬廣。生命際遇各自不同的四個靈魂,在人生這張地圖上交錯前行,彼此纏繞又轉瞬消逝。面對旅途中的每個岔路,他們會做出什麼選擇?當漫遊變成探索,漂浪轉為追尋,旅程的盡頭,會有他們想要找的那個人,或者答案嗎?旅人歸來回首一望,種種混亂都已經過去了,一切才剛開始而已。
⠀⠀⠀⠀⠀
此次翻譯小說特別想讀的,有《林肯在中陰》作者喬治桑德斯小巧精美的《#狐狸小八》,他回歸短篇小說場域,加上喬西卡迪諾的插畫,有著喬治歐威爾式荒謬的情節設定,狐狸寫給人類的一封信,卻真實地切中人與自然日益惡化的衝突。不過,桑德斯始終相信本質上是道德的,可以引導我們更好地去愛。只要記得,整個故事的敘事者是隻小狐狸,他嘗試學習語言與「人累」溝通,我們生而為人可以更溫柔地對待自然嗎?人類該如何回覆狐狸小八?闔起書本看著書封,不難發現作者虔心期許眾生的良善、平等與和諧。
⠀⠀⠀⠀⠀
以及另一本同樣短小精悍的作品,西班牙作家胡利歐亞馬薩雷斯寫於 1988 年的《#黃雨》,被譽為是歐洲二十世紀文學的顛峰之作。在庇里牛斯山區一座荒廢的小村艾涅爾,1970 年代,那裡完全廢村。但屋舍仍矗立原地,在靜謐中、遺忘中,在冬雪中緩慢腐朽。老人安德烈斯是廢村僅存的最後一位居民。在寂靜和冬雪的包圍下,在悲涼和屋舍的廢墟之間。嚴冬漫長的十二月夜裡,只剩他孤零零一個人在艾涅爾度過黑夜。他喃喃念起逝者的眼眸、盤根錯節的回憶,那些死寂佔據破落凋殞裡的清醒與夢囈。這座村莊是真實存在的。瀰漫全書的孤獨、絕望、夢境與回憶,難以抵抗的時間年輪,深入存在的虛無,內心的孤絕、無力,理智和瘋狂。訴說時代如何遺棄鄉村,留予靜謐大地深沉的平靜。黃雨洗去一切,沒有人被銘記。
⠀⠀⠀⠀⠀
還有等待許久的《魔戒》托爾金中土三大傳奇最終章《#剛多林的陷落》,繼《貝倫與露西恩》、《胡林的子女》之後,見證了第一紀元走向終結。這三大傳說既是《魔戒》那宏大背景的組成元素,更是《精靈寶鑽》必不可少的基石。講述人類圖奧在剛多林的旅居,包括他與精靈伊綴爾的結合、兒子埃雅仁迪爾的出生、部臣邁格林的背叛、隱匿之城的陷落和諾多族倖存者逃亡的經過。這個故事在托爾金想像的中土世界觀第一紀元中占舉足輕重之意義。遺憾的是,托爾金平生寫出的完整版本便僅止於那創作於青年時期的文稿,他雖曾著手重寫,但並未完成全稿。透過其子克里斯多福托爾金的整理,此書得以面世。
⠀⠀⠀⠀⠀
當然,克蘇魯的話題還繼續延燒,《#夢尋祕境卡達斯:H.P. Lovecraft 幻夢境小說傑作選》仍不容錯過。《幻夢境小說傑作選》,是由一連串異次元空間幻夢境的相關故事所組成,收錄的十篇故事,以藍道夫.卡特的冒險事蹟作為主軸,再加上幻夢傳奇的重要篇章《奈亞拉索特普》、《烏撒之貓》與《末日降臨薩納斯》,和劇情看似獨立、卻對後續故事有重要連結的恐怖短篇經典《皮克曼的模特兒》,以及將上述元素串聯在一起的長篇故事《夢尋祕境卡達斯》。幻夢傳奇與克蘇魯神話最大的不同,就在於它偏向帶有微妙恐怖的奇幻故事,而非完全傾向克蘇魯神話深淵般的太空恐怖劇情。此外,洛夫克拉夫特在其他故事偶爾提及的諸多神祕地名(像是《死靈之書》中經常提及的冷之高原),也會在本書中完整呈現在讀者眼前,讓這個系列,與《克蘇魯的呼喚》相關故事息息相關,卻又展現出自己獨特的生命力。有趣的是,在這裡,作者本人的化身藍道夫卡特,會如同神話故事中的英雄,循序漸進,帶領讀者深入幻夢境,首尾相連,將各個段篇故事拼湊為一個完整的冒險歷程,打造出一個如同《魔戒》般,精彩刺激的傳奇故事。
⠀⠀⠀⠀⠀
同樣帶有奇幻色彩的療癒小說是《#歡迎光臨夢境百貨:您所訂購的夢已銷售一空》,這個百貨公司是睡著後才能入場,客人們入睡後,進入最受歡迎的「達樂古特夢境百貨」,挑選陳列在眼前的各色夢境:想再次相見的人、期待前往的地方、害怕又想突破的事物,以及超乎想像、上天下海的瑰麗夢境等等,每一層樓都提供別出心裁的夢。這棟五層樓的百貨門庭若市,有睡長覺的客人,也有短暫睡個午覺的人類和動物。新人佩妮通過了與達樂古特本人進行的一對一面試,來到夢境百貨上班,準備好好推銷各個傳奇製夢師所設計的夢。然而,當她好不容易稍稍搞懂測量睡意的「眼皮秤」、從「夢境滿意度」轉換的支付系統等細節後,竟然惹下大禍,最貴的夢境費用從她手上被偷走了。眼看工作即將不保,她該如何化解困境?在這神祕的夢境百貨,在清醒與睡夢的邊界,她又將遇見什麼樣的人,以及他們心中渴求已久的夢?
⠀⠀⠀⠀⠀
若注重推理閱讀樂趣的人,應該不容錯過這本暢銷小說《#喜鵲謀殺案》,當編輯蘇珊拿到艾倫康威最新作品的書稿時,她怎麼也不會想到這本小說即將改變她往後的一生。和這位暢銷推理作家合作多年,蘇珊對他筆下的偵探艾提克思彭德瞭若指掌。而艾提克思彭德系列是蘇珊任職的三葉草圖書出版最暢銷的書。為了工作蘇珊別無選擇,只能忍受艾倫種種惱人的行為舉止。在艾倫的新作中,艾提克思彭德來到派伊府邸,一座鄉村內的莊園調查一樁謀殺案。是的,其中有死屍和許多各懷鬼胎的嫌犯。然而隨著情節的推演,蘇珊不禁越來越懷疑,在這份書稿字裡行間隱藏著另一個故事:一個充斥著嫉妒、貪婪、冷酷的野心,以及謀殺的真實故事。
⠀⠀⠀⠀⠀
接下來兩本是與女性議題有關,首先是關於一場性侵案與一封陳述書,打動上千萬人,也改變了美國司法的花漾女子故事《#這是我的名字》。2015 年 1 月 17 日,香奈兒米勒遭到史丹佛大學生布羅克特納酒後性侵。隔天,香奈兒在醫院醒來,才得知自己成了被害人。她不再只是香奈兒,在法律上,她被賦予了一個新的匿名身分:無名艾蜜莉 Emily Doe。香奈兒與艾蜜莉各自過著不同的生活。香奈兒繼續上班、社交、過日子,但她開始失眠,還會在沒人看見的地方獨自流淚、崩潰。艾蜜莉活在一個封閉的世界,她活在法院、警局,活在證詞與質問當中。沒人知道艾蜜莉是誰。而布羅克,這位有望代表美國參加奧運泳賽的明日之星,在被捕後不到二十四小時,就以十五萬美金交保,重獲自由。2016 年 6 月,歷經將近一年半,審判結果終於出爐,布羅克僅遭判監禁六個月。數日後,網路媒體 BuzzFeed 刊登了無名艾蜜莉的法庭陳述書,四天內點閱率破 1100 萬,引爆全美輿論。無數人民站上街頭聲援艾蜜莉,時任美國副總統拜登也公開支持。2018 年 8 月,加州針對性侵罪修法,該案法官遭罷免,布羅克的上訴被駁回,史丹佛也將他退學。艾蜜莉獲得了遲來的正義。2019 年,艾蜜莉以本名出版此部自傳《這是我的名字》。
⠀⠀⠀⠀⠀
後者是被稱作少女版《使女的故事》的南韓作家尹異形《#兩封合格通知書》。女孩收到卵子評鑑合格通知書,根據最新生育法案,她必須在卵子迅速老化之前短短三個月內,進入生物資料庫尋找「準爸爸」,準備懷孕。如能順利生下小孩,將會獲得不愁吃穿的財富,簡直比進入理想大學更令人嚮往。自身亦是人母的韓國文壇怪物級新銳小說家尹異形,自道內心的女性主義者於江南站隨機殺人案之後被喚醒,對於女性遭輕視物化的現狀無比憤怒。本書虛構的駭人法案左右著青年的生涯抉擇,「生育」赤裸裸地淪為階級晉升的工具。擁有生育能力,難道就非得拯救人口危機不可?小說直指當今社會制度弊病,讀者驚嘆字字句句引人痛切共鳴。作者多次強烈表示,「不要繼承這個世界,不要繼承我們現在的生活。」無論是對自己生育的孩子,或是對這個世界的年輕世代,她都傳達了不得不把如斯醜陋世界交給下一代的歉疚感。她說自己的名字意思是「奇異的形狀」,特立獨行,敢於說出人所不能言。自從江南站隨機殺人案發生後,尹異形才真正意識到,自己所處的世界是多麼輕視女性、多麼獨尊父權意識。在數年後迅速席捲全球的 #MeToo 浪潮之下,她仍持續以書寫探索女性在和平狀態與受迫處境之下的各種不公體驗。
⠀⠀⠀⠀⠀
最後是,不知道該怎麼拍進去的金磊《#鯨豚記》,觀賞過紀錄片《男人與他的海》的觀眾對作者應該並不陌生,榮獲英國自然史博物館「年度野生動物攝影師大賽」民眾票選大獎、法國「P×3 巴黎國際攝影大賽」金牌 、美國「IPA 國際攝影獎」榮譽獎等國際攝影大獎殊榮,台灣首位水下鯨豚攝影師金磊,大學畢業後,來到花蓮成為海上解說志工,開啟他往後 20 年的鯨豚追尋之旅。從水面上的影像開始,為了熟悉活動於不同海域的鯨豚種類,金磊前往世界各地下水拍攝鯨豚,磨練出深厚的水下拍攝技能與心法。一路追尋,堅持夢想的他,足跡遍及東加王國、日本御藏島、阿根廷巴塔歌尼亞、挪威極圈,與夢幻如抹香鯨、大翅鯨、南方露脊鯨、藍鯨、虎鯨近距離接觸,並拍下牠們的美麗身影,其中包括悠游台灣海域近 30 多種的鯨豚紀錄。全書收錄超過 200 多幅珍貴影像,金磊從拍攝鯨豚中認識自己,享受過在水中與鯨豚共游的震撼奇妙感,突破了恐懼、沮喪、撞牆的內心爭戰,更體悟到自己與自然之間的關係。透過過往生命歷程的反思,他在書中娓娓道出一張張令人驚奇影像的背後故事,那一段段的海洋冒險,難忘的神奇旅程,亦是他為邁入第 30 個鯨豚拍攝生涯所做的一次深度回顧。
⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀
⠀⠀⠀⠀⠀
(以上文字部分自出版社書介。)
「機器學習面試200題」的推薦目錄:
- 關於機器學習面試200題 在 一頁華爾滋 Let Me Sing You A Waltz Facebook 的精選貼文
- 關於機器學習面試200題 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
- 關於機器學習面試200題 在 李開復 Kai-Fu Lee Facebook 的精選貼文
- 關於機器學習面試200題 在 Re: [請益] 想從零開始轉行當AI軟體工程師- 看板Soft_Job 的評價
- 關於機器學習面試200題 在 數據分析那些事- 機器學習面試題集錦終於過半啦 的評價
- 關於機器學習面試200題 在 機器學習面試200題 :: 全台大學開課課程資訊網 的評價
- 關於機器學習面試200題 在 amusi/AI-Job-Notes: AI算法岗求职攻略(涵盖准备攻略、刷题 ... 的評價
- 關於機器學習面試200題 在 ai工程師面試考題的問題包括PTT、Dcard、Mobile01 的評價
- 關於機器學習面試200題 在 ai工程師面試考題的問題包括PTT、Dcard、Mobile01 的評價
- 關於機器學習面試200題 在 ai工程師面試考題的問題包括PTT、Dcard、Mobile01 的評價
- 關於機器學習面試200題 在 Re: [心得] 2021 外商資料科學求職心得 的評價
- 關於機器學習面試200題 在 2019暑期實習面試心得 的評價
- 關於機器學習面試200題 在 15分钟了解七大最常见的机器学习面试问题。 - YouTube 的評價
機器學習面試200題 在 李開復 Kai-Fu Lee Facebook 的最佳貼文
創新工場DeeCamp 2020正式啟動。歡迎向我們推薦優秀的學員。
世界在變,DeeCamp 初心不變。新內容,新形式。新人才,新使命。一個半月時間,免費聆聽學術大師、工業界領軍人物親身教誨,學習科技與創投規律,實踐用AI解決前沿問題。只對全球在校大學生開放!過去兩年也都有台灣同學來參加哦。
下文來自創新工場微信公眾號
………………………………………………………………
DeeCamp 2020啟動,邀請全球AI菁英共克世界變局下真實難題!
2020 年是不尋常的一年。世界在變,初心不變。即日起,創新工場聯合華為共同推出“DeeCamp 2020 全球 AI 領軍人才培養計畫”。
圍繞“世界變局下的 AI 人才新使命”這一核心主題,入選的 200 位高校大學生將在一個多月的時間裡,接受世界頂尖導師陣容的授課指導,嘗試用創新思維和前沿 AI 技術,迎接新挑戰,解決新問題,擔負起 AI 人才的新使命。
DeeCamp 訓練營面向所有電腦、數學、自動化等AI領域相關專業本、碩、博在校生開放報名,全程免費。
DeeCamp 2020 全球 AI 領軍人才培養計畫分為大師課和開放性競賽兩部分,課程和專案實踐全部轉為線上進行。成功加入訓練營的200名學員,將獲得多位 AI 科研及產業領域頂級大師親自線上授課。他们有:
▍李開復 創新工場董事長兼CEO
▍張亞勤 世界級科學家和企業家,清華⼤學“智慧科學”講席教授
▍吳恩達 全球知名的人工智慧專家,Coursera的創始人及董事長,斯坦福大學電腦系兼職教授
▍張宏江 世界多媒體和人工智慧研究領域一流科學家,源碼資本投資合夥人
▍周志華 人工智慧領域世界級專家,國際AI學會“大滿貫” Fellow華人第一人,歐洲科學院外籍院士,南京大學人工智慧學院院長
▍張潼 人工智慧領域世界級專家,機器學習、大數據分析領域的頂級學者,香港科技大學電腦系和數學系教授
▍俞敏洪 新東方教育科技集團創始人、董事長,洪泰基金創始合夥人
▍徐輝 創新奇智聯合創始人、首席執行官,創新工場合夥人
▍唐文斌 曠視聯合創始人兼首席技術官
▍曹旭東 Momenta創始人兼首席執行官
▍汪華 創新工場聯合首席執行官,管理合夥人
▍王詠剛 創新工場首席技術官,創新工場人工智慧工程院執行院長
學員們還能與來自全球的 AI 精英共同組隊參加線上競賽,衝刺大獎。此次,DeeCamp 人工智慧訓練營將以往的線下實踐課題改為線上競賽形式。
不同於常見的 AI 領域競賽,DeeCamp2020 開放性競賽不以完成某一具體指標為目的,而是讓同學們組隊完成一個完整的創新項目,鼓勵其用創意向現在和未來人類面臨的科技問題發起挑戰,找到用 AI 技術改變真實世界的機會。對於提交的最終結果,評委將從“創新性、先進性、潛在價值、呈現結果”四個維度進行評估,最終評出總冠軍及各賽道冠軍,最高獎項獎金達人民幣100,000元。同時,優秀學員還有機會參加與神秘科學家評委的午餐/晚餐交流會!
DeeCamp2020 開放性競賽共設立五大賽道:
• 用 AI 應對醫療和公共衛生領域的新挑戰
• AI 賦能的商業決策與商業流程優化
• 自動駕駛的技術突破與前沿創新
• AI 驅動的教育新工具和新方法
• 人工智慧的創新思考與前沿設計
▍賽道一:用 AI 應對醫療和公共衛生領域的新挑戰
COVID-19 新冠病毒讓全世界共同經歷了恐慌、病痛和隔離,也凸顯出全球公共衛生危機對全球經濟與個人生活的重大影響。科技是扭轉戰局、提高社會組織與協同效率、提升全人類衛生水準的重要武器。無論是疫苗研製,新藥研發,臨床數據分析,流行病學分析,還是對與疫情相關的社會學、傳播學等問題進行深入調研,以大數據、機器學習為代表的人工智慧技術都可以發揮重要作用。
請加入我們,一起探索用大數據、機器學習等前沿科技改變全球公共衛生狀況,應對全球危機的新思路、新方法、新技術和新產品。
▍賽道二:AI 賦能的商業決策與商業流程優化
全球經濟和投融資環境進入了 2008 年金融危機以來的又一個艱難時期:經濟全球化的美好願景正遭遇貿易紛爭、意識形態分歧乃至全球疫情的多重打擊,資本市場和供應鏈生態面臨極大的不確定性。
新一代的大數據和人工智慧技術該如何幫助人類更好地應對危機?如何根據市場、行業、社交網路等數據更準確預測經濟趨勢並指導商業決策?如何利用 AI 技術提升商業運行效率,優化供應鏈管理等核心業務流程?
請與我們一起探討用 AI 技術輔助商業決策或提高商業效率的創造性方法,更好應對全球經濟變局。
▍賽道三:自動駕駛的技術突破與前沿創新
自動駕駛是人工智慧眾多領域中,最具技術挑戰性和應用前景的方向之一。最近幾年,自動駕駛的科研、產品和工程團隊越來越注重在真實場景、真實約束條件下打磨演算法和產品,力爭儘早實現自動駕駛技術的大規模商用。隨著自動駕駛所依賴的感測器、車載晶片、車聯網等技術的不斷發展,前沿人工智慧演算法有可能在更高效、性價比更好的自動駕駛平臺上突破更多的技術與產品瓶頸。
在本賽道中,團隊有機會利用真實場景採集的高品質數據,結合真實計算環境,學習和實踐自動駕駛技術在產品、工程領域的最佳路徑,並挑戰演算法和算力的極限。
▍賽道四:AI 驅動的教育新工具和新方法
教育是人類智慧得以延續和發展的載體。以 AI 為代表的前沿科技,已經在今天的各類教育平臺、各種教學形式中發揮了積極作用,即將成為未來教育的主導因素之一。
如何利用科技手段實現真正的因材施教?如何幫助老師規劃教學路線、提高教學效率?如何通過智慧互動、自動測評、持續改進等形式激發每個人的學習潛能?
AI 時代,教育工具和教育方法將在技術推動下持續變革。你們的技術、創意與工程實現,也是這一歷史變革的重要環節。
▍賽道五:人工智慧的創新思考與前沿設計
自上世紀四五十年代發端以來,AI 技術經歷多次反覆運算,今天以深度學習為代表的新一代 AI 已經創造出超越人類的圍棋程式,可以自動駕駛汽車的智慧演算法,可以獨立執行任務或與人協作的機器人……但AI在認知能力、推理能力、對複雜環境的感知能力、在複雜場景中的規劃和決策能力等方面,還與人類水準相差甚遠。
人類與生俱來的創造力對AI是九重天外的挑戰,有哪些新思路、新方法、新技術可能幫助我們開闢更廣闊的 AI 新天地?請利用你們的科研積累,發揮你們大膽突破的創新能力,用最直觀的創意演示系統向人們揭示 AI 未來可能的技術路線與應用場景。
▌報名流程及時間安排
時間安排:
報名及選拔時間:即日起至5月29日
學員名單公佈:6月3日
大師課上課時間:6月6日至7月5日每週六周日上午
開放競賽成果提交:7月26日
競賽結果公佈:8月5日
報名流程:
考慮到今年上半年全球大學師生的實際情況,本屆DeeCamp採用導師或實驗室推薦與自薦報名相結合的方法,並根據推薦和自薦材料綜合選拔錄取。
1)官網註冊:在 DeeCamp 官網(deecamp.com)完成註冊並填寫個人資訊;
2)準備申請材料:pdf 檔需在個人中心上傳,視頻請上傳至組委會可以訪問的平臺並在下一步報名時填寫訪問位址;
3)點擊報名:進入活動頁面點擊報名,提交必要資訊並完成報名;
4)等待通知:你可能會收到一次遠端面試的邀請,請留意郵箱資訊並準時參加。
*申請材料包括:
一份 PDF/DOC/DOCX 格式的檔,內容包括你的簡歷、項目經歷、曾獲獎項、曾發表論文及對應會議/期刊、推薦信或自薦信,以及其他能讓我們知道你很優秀的材料,請整理在一個檔裡集中上傳;
一段自我介紹視頻,時長 3 分鐘以內,將用於向選拔參考(可選項,建議提供,以便我們更好地瞭解你)。
▌關於DeeCamp人工智慧訓練營
DeeCamp 的名字來自歷史上由 O' Reilly 組織的 Foo Camp(一個完全由與會者設計流程、議題、內容的 unconference)。DeeCamp 用類似的命名方式,希望建立一個為學生服務、充分發揮學生自主精神的 Deep Learning Summer Camp,既有統一的課程和專案安排,也借鑒 unconference,放手讓學生自我組織、自我管理、自我表現。在 2019 年度暑期訓練營期間,學員們在順利完成課程和實踐的同時,自行組織了 24 場分享會,涵蓋深度學習、機器學習、對抗神經網路等十餘個主題。
DeeCamp 訓練營由創新工場於 2017 年發起,旨在提升高校 AI 人才在行業應用中的實踐案例經驗,同時推進產學研深度結合的公益性質 AI 訓練。
在過去的三年中,DeeCamp 總計收到來自全球 1000 餘所高校超過 20000 份報名申請,已有 1000 余名學員順利結業。
到 2019 年,DeeCamp 人工智慧訓練營已初步建立了以創造性的團隊工程實踐專案為主幹,以打通學術、產業邊界的系統性知識培訓為支撐,聚焦未來科技變革與商業發展,成規模、可複製的人工智慧應用型人才培養體系。
DeeCamp 獨創的“知識授課+實踐專案”模式,讓學員們既可以近距離與科研及產業領域大師溝通交流,也可以與志同道合的小夥伴結隊,親身體驗 AI 技術如何轉化為產業應用、積累實踐案例經驗。
聯合主辦方:創新工場、華為
雲平臺:華為雲
課題合作企業:曠視科技、Momenta、路孚特
合作媒體:量子位
報名連結:https://deecamp.com/#/activityRegistration?id=1
機器學習面試200題 在 李開復 Kai-Fu Lee Facebook 的精選貼文
40歲的男人, 更懂得珍惜
想不到結局的微小說
本文來自創新奇智微信公眾號
……………………………………
“李先生...李先生...您現在可以進去了...“一個溫柔的聲音從身後傳來。
George突然回過神來,沒有意識到“李先生“是在叫自己。 多年來, 他已經習慣了別人稱呼他的英文名字。溫柔可人的HR Intern把George引領到了一個會議室。這是George人生中為數不多的面試。
他剛剛還沉浸在昨晚的生日場面, 42歲的生日, 5歲可愛的女兒為他挑選了生日蛋糕,為他唱生日歌,還膩膩的在他的臉頰上親了一口,撒嬌的說:“爸爸的鬍子好紮...” 他內心充滿了幸福感,但同時也擺脫不了內心的焦慮,因為...
▍part1
前幾天的早晨,他照例像往常一樣早起對著鏡子刮鬍子、洗臉,穿上太太熨燙平整的白色襯衫和西裝開車去公司, 但剛進辦公室,氣氛格外的凝重,幾個來的早點同事嘀嘀咕咕。他有一種不祥的預感。原來,美國總部突然宣佈了重大決定,公司裁員一半。從即日起,全球同時開始裁員計畫, 美其名曰:企業轉型,Run Simple。有些部門全部下崗,然後內部擇業,重新上崗。“鬼才信這種下崗、上崗的方式。 各部門都裁員,哪來的Headcount?” 他走過Linda身旁,聽見她在生氣地打電話。 “裁就裁唄,最好能給N+4的賠償,這樣我們可以一起組團去歐洲玩一圈嘍!”旁邊兩個90後入職不到1年的小夥子貌似開心的低語。
George是公司的老員工,雖然沒有做到People Manager, 但以他的資歷和工作能力,也算公司元老級人物了。George碩士畢業後, 在一家小公司工作不到2年,由於在和這家世界500強外企X公司合作時表現出色,被X公司業務主管直接邀請。面試流程很簡單,他至今記得這個場景。 當時, 理工科畢業的George叫李闖,26歲, 標準的技術男,甚至去世界500強外企面試,他還穿著灰色圓領T恤和藍色牛仔褲。索性的是,身材還不錯,沒有邋邋遢遢的感覺。 因為直屬領導和李闖很熟,所以HR面試基本是個過場。 他還記得,HRD是個成熟美女,帶著一副紅色邊框的眼鏡和性感紅唇。他進門的時候確實被精緻的臉龐和誘人的身材吸引了,但1秒鐘之內, 他收回了眼神,甚至有些臉紅。 他已經記不清自己是如何回答各種問題。 總之, 最後美豔的HR主管對他說:“你今天的面試我很滿意。” 從此, 李闖改名為George,進入了世界500強的隊伍,一改就是很多年。
▍part2
George跟隨HR美眉進入了會議室,筆挺的Armani西裝,盡顯George勻稱的身材。George沒有打領帶,反而上面兩顆扣子沒有系。 這是George的小Tip,但凡見女性領導或客戶,均如此。 2年前的George在體檢時,查出重度脂肪肝、血壓高。40歲的他,身高180,體重達到190斤。銷售壓力大,常年出差生活無規律,燈紅酒綠、酒精沙場的惡果。醫生提醒他,再不改善身體就會出大問題。 加上女兒剛出生,讓他突然明白,身體是用來保養的,不是用來揮霍的。
他開始出差必帶運動鞋,外企出差五星酒店都是有健身房的,無論多晚他都會堅持完成自己制定的健身計畫。 他迅速的從200斤降到160斤,減脂增肌。短短的1年時間裏,就已經實現了完美身材。 George從小學習成績出色,從小一路保送,高考從一個省會級城市考入北京,本科直接保送研究生。一路的順風順水,得益於兩個字:堅持。健身也不例外,他一旦設定目標就一定要達成。當女同事們在討論彭於晏勵志的健身故事,形象的描繪結實的胸肌和腹肌時, 他嘴角都會露出不被人察覺的笑容。
▍part3
面試之前, 他做足了功課, 這也是他多年打單的經驗, 越瞭解對手,自己越從容。眼前這位HRD和自己的猜想沒什麼出入。 身材高挑,亞麻色齊肩中發,一字肩的緊身黑裙,露出了漂亮的鎖骨。 最新款的TIFFANY的鑰匙鑽石項鏈,顯得非常有品位。 還有,修長的食指上時尚的BVLGARI的蛇形戒指。
這位HRD從上到下看了他兩遍,穿過白色的襯衫,仿佛看了他苦心修煉的肌肉。視線掃過了IWC的腕表,以及Ferragamo的皮帶,還有他左手無名指的婚戒。現在,他不像26歲那樣還會臉紅得不知所措。相反,他用淡定的眼神直視對方的打量。
HRD趕緊收回了目光,開始了面試的對話。 “看了您的簡歷,世界500強光鮮的背景,每年都能獲得top sales,真是很羡慕...不過...聽說X公司最近突然大規模裁員,您離職的原因跟這有關麼? “ ...“還有個小問題,您的年齡...今年42歲了麼?” ...“雖然您看上去很年輕,但我們公司的規定是,中層管理者不能超過35歲, 高層管理者不能超過40歲...”
這句話是George來之前就料想到了的。 因為, 獵頭幫他遞到BAT的簡歷剛剛被拒掉。 唯一的一個理由就是:年齡超過了40歲。 他心裏像吃了一只死蒼蠅一樣的不爽。“ TMD有誰知道,Top Sales 背後有多少的辛酸?沒日沒夜的打單、催單、收款,每個季度都會面臨著清零,就像百米賽跑,剛剛得了第一,氣兒還沒喘勻,就要再衝刺下一個100米,誰能保證每一段百米都能保持第一?....
沒辦法, 他還是要面對這樣的場景。 他凝視了HRD 3秒鐘,淡定的說:“30歲的小夥子確實很有體力,有沖勁兒,也有創造力。 但你們招的是VP,方向把握是需要經驗的,光憑體力和創造力是不夠的。並且,40歲的男人,相比30歲的男人來說,更有責任感、更懂得珍惜。 30歲的男人還有試錯的機會,用自己試錯、用公司來試錯。但對於40歲的男人來說,只有成功,不能失敗。對自己的承諾,就是對公司的承諾。”HRD對這番話點了點頭,表示默許。
之後,他闡述了對銷售VP的業務規劃,就像他面對每一次考試、每一次競標一樣,都是有備而來。“你是一個不可多得的人才, 我會跟CEO推薦你,建議他打破年齡規定,因為對一個創業型公司來說,在所有候選人中,沒有一個像你這麼合適這個職位的。” HRD似乎被他深深的折服和吸引了。
George起身告辭。突然HRD叫住他,“等等....”HRD雙手捧著一本書。“送你!”George看了一眼,“不必了。 《AI·新世界》嘛,剛出版時我就讀過了,我是開復老師的粉絲,不光中文版, 我連英文版的《AI Superpowers》我都讀過了。你我都是屬於右上角象限的人才,屬於最後才會被機器替代了。”嘴角又露出了招牌式的微笑。
美女HRD望著George的背影,想說什麼,但又止住了......
據獵頭說,現在這家很火的人工智慧公司還在招人
★熱招職位 ★
01
圖像演算法工程師
02
技術總監-CV方向
03
大數據工程師
04
ios開發工程師
05
軟體測試經理
06
機器學習演算法工程師
07
運籌優化演算法工程師
08
運維開發高級工程師/經理
09
高級後端(python/java)開發工程師
10
前端開發工程師
# 聲明:本故事純屬虛構,若有雷同,切勿對號入座
作者:睡不醒的貓
機器學習面試200題 在 數據分析那些事- 機器學習面試題集錦終於過半啦 的推薦與評價
機器學習面試題集錦終於過半啦~ 3月的第一份學習list,請收好~ · ALLABOUTDATAANALYSIS.MEDIUM.COM. 機器學習面試200題!(101-120). 機器學習面試200題(六), ... ... <看更多>
機器學習面試200題 在 機器學習面試200題 :: 全台大學開課課程資訊網 的推薦與評價
来源:CSDN.本篇是機器學習面試200題第二篇,由於篇幅太長,本篇介紹21–40題,感興趣的話請持續關注唷XD.系列篇(1)指路: ...,機器學習面試200題!(61-80).来源:CSDN. ... <看更多>
機器學習面試200題 在 Re: [請益] 想從零開始轉行當AI軟體工程師- 看板Soft_Job 的推薦與評價
來用自己的例子勸退一些想跳機器學習的人
首先是數學程度,
我是數學系的,什麼線代,微積分,機率,統計的都很熟其實工作也會用到,
描述一些比較有印象的工作用過的數學,
比較有趣關於微積分的經驗:
老闆把問題用一個式子 exp(-rx)*((1/delta)*sqrt(A))*exp(-x^2/(A))來解釋,
並要對x積整個實數範圍。
在場大家都面面相覷我就被要求積了。
但這其實不難積,就高斯積分,有背整理一下秒解,
沒背也不難推。我大學微積分沒在背的所以是當場直接推,然後才繼續那場會議。
機率統計就那些常見的像是:
在一堆數據中給一些想法假設然後檢定,
或是想辦法對一直變動pattern的資料去建對應的機率模型。
但我具體數學程度到哪,舉兩個例子一個是深度學習WGAN一個是經典的random forest。
https://arxiv.org/pdf/1701.07875.pdf 這是WGAN。
https://link.springer.com/article/10.1023/A:1010933404324 這是RF。
基本上裡面的純數推導我幾乎都理解,
WGAN用到實分析跟線性規劃,
RF則是機率。
以上大概描述一下我的數學程度。
接著是我的電腦技能,
我熟悉的語言有C++跟PYTHON,基本上各有兩年以上的工作實務經驗。
python就絕大部份公司機器學習用的語言不解釋。
C++曾被公司要求所有演算法都要自己刻,這之中還包刮神經網路,
連 backpropagation 都要自己刻,
然後資料結構演算法,計算機組織,作業系統都讀過。
至於程度到哪我也不好說,我自知去參加程式比賽會被電死,但基本程度應該是有。
資料結構的程度至少是在刷題的時候不會卡在"天啊這個是什麼資料結構",
跟曾經在工作被要求刻了一個紅黑樹,雖然我現在忘了而且skip list太好用。
演算法就刷題的時候不會無止境一直設條件,
會嘗試用一些演算法想法比如 divide and conquer or dp 來解題。
計組作業系統就是那些什麼cpu pipeline 記憶體管理緩存設計都懂。
資料庫則是公司用什麼我就學什麼。
機器學習的部分就是幾乎現在大家喊得出名字的我都可以實作,
有要證明的模型我都可以證明,不過需要回憶準備一下哈哈因為模型太多沒全記。
大致用書來表示一下我懂得大概範圍好了。
https://www.deeplearningbook.org/
deep learning 的經典不解釋。
https://www.cs.cmu.edu/~tom/mlbook.html
machine learning 也算經典但很老的一本了。
https://www.tenlong.com.tw/products/9787302275954
各種經典的機器學習模型的推導書,雖然這個作者幾乎只是翻譯論文,但翻的還滿好的。
新技術太多我就不提了我都有在追。
以上大致描述一下我的程度,目前的結果是我近半年完全找不到工作XD
不管國內國外,丟履歷都沒回覆,基本上連面試機會都沒有。
搞得現在只能送foodpanda,
真的是能力不足阿...
希望這慘痛的經歷能拯救還想再跳AI的人阿。
==================================================
發現太多人執著實作的部分,其實要求手刻的只有一家公司,雖然我也在那邊做很久
除了那間公司其他的我也是用包啦,Tensorflow,cntk 之類的都會用。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.137.88.3 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1636524507.A.D68.html
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:12:47
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:23:19
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:31:53
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:42:43
改丟國內的國內也都沒回覆,慘
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 14:54:17
爛的資料神經網路無法處理因為神經網路是強逼近,就垃圾進垃圾出
但數學反倒可以找到很好的方向,
比如說我處理過那種雜訊很多就算了,哪些是雜訊還都不知道的數據。
方法就把資料換個方便我弄成隨機過程的樣子,
然後抽特徵的時候隨機,根據大數法則我可以期待他會逼近一個我要的值,
且也可以淡化雜訊的影響畢竟是隨機取,最終效果很好這樣
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 15:16:24
我只是想表示這麼基本的東西我都有公司也是不要阿
真的要說的話不然你試著準備一下那個WGAN的中為什麼Wasserstein比原本的GAN的cost function 還要好的證明然後試試?
最好還要問李航那本書沒有的,像是PCA為什麼是用特徵值,還有上面說的RF為什麼可行
L1 L2 為什麼會有那些效果怎麼用數學分析,BLABLABLA的
哀我真的只是想勸退還想進AI的人啦
這個東西真的水很深而且缺很少啦
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 17:34:07
不過主要是我都把時間拿來唸書了。
我沒在經營github,我是不知道自己的讀書心得丟那有沒有用,
我應徵時到是有附一些讀書的筆記,
像是上面提到的GAN的一些東西,為什麼強大,為什麼難訓練,WGAN為什麼強大,
能怎麼修正的一些整理都一起寄過去,展現我不是嘴巴說說有在讀書,是真的有在讀深入的
且工作上工也有用到,但一樣沒用哈哈哈哈
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 18:04:21
所以我才真心建議不要再跳進AI了,沒想像地這麼美好
本職學能持續精進,有需要再碰就好了。
其實我在找工作,現在大部分的缺都是傾向:他們方法有了。
機器學習工程師就是架構一個data pipeline,然後建模型訓練,接著實際應用。
最終就是要自動化。實際有關機器學習的問題去跟公司的data scientist 討論即可,本質?
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 18:11:18
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 18:13:02
kaggle還要考慮我手邊的的裝備,所以能做的題目大概也都是那些普通的題目
最主要的問題就是我學經歷不夠,所以我相信現在有想跳AI的一定都是一樣的狀態
所以這篇的重點一直都是:拜託,別在專門跳機器學習的領域,好好點高自己的技能比較實?
而不是討論我為什麼沒工作沒面試阿。一直討論我為什麼沒工作不是很好笑嗎= =
現在就是僧多粥少,不只如此,那些還不是僧只是剃光頭阿。
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 18:56:44
不過撇開這個,我是有考慮分析不少事情。
而結論是:
那個時間成本不如拿去刷題,從SDE的路進公司,在從公司內部轉比較有機會。
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 19:02:56
其實我不強啦哈哈我不是四大數學系的哈哈,我只是愛讀書而已。
其實專案量化成績是有啦,但我不知道是不是命運使然還是怎樣。
我舉的這個例子,是我進公司之前他們搞了快兩年都沒結果,因為一直在用傳統的CNN做
真的是各種花俏CNN,連deepfake都被拿來用
但我進去觀察一下資料就覺得不適合,所以花了很多時間在搞數學方法
然後撇開新創有的沒的雜事和動不動就換目標,七八個月後也是不容易地搞出來了。
然後老闆很高興地拿去做了一些事,後續的一些計畫也開始在動時,老闆走了...
結果業務端好像都是老闆在搞,老闆一去世公司就炸掉了。
所以這個就沒下文啦,後續是有人私底下要跟我買,我覺得麻煩也不道義就沒賣了。
但我其實不想講太細節就是因為這看起來超像嘴砲,所以想著重在方法跟技術知識面而已
不過就算被當嘴砲也沒差反正人生是我自己的哈哈
所以我比較願意刷題而起也滿享受的。但請注意我知道這之中的差異,
KAGGLE"可能"會讓我"多一點"面試的機會,而刷題會讓我現階段往SDE的方向走。
我刷題是為了增強自己的能力,而不是為了"機器學習相關工作的面試"
不過話說回來我真的覺得太聚焦我的狀況了
直接說我目前的打算,我還想工作只是為了存點應急錢去唸博士,
現在應該就是不會在嘗試存應急錢直接去唸博士,我也確定我愛研究,
我直覺判斷我讀博時intern應該會好找,應該啦。
所以大家別在聚焦在這個啦哈哈哈
※ 編輯: stmilk (223.137.88.3 臺灣), 11/10/2021 22:11:49
當時我處理的影像超稀疏的。gan難train是在那個模型非常
容易被一個函數分開,也就是可以找到完美的discriminato
r,這是這兩個機率support的問題,而且條件還不用是這兩
個support不相交,只要幾乎處處不相交就可以,這個至少廣
大的實驗告訴我們非常容易發生。所以本質上只要是那個co
st function,初始值不好不管做甚麼調整丟什麼模型進去都
會遇到這個問題。然後可能是我的處理的影像真的太稀疏,
應該是可以理解成這個pattern的support超小,基本上根本
train不起來。所以我那時的想法是就是想要一個理論上直接
可行的結果。這樣我不用把模型弄得巨爆幹複雜,設計一堆
有的沒的只為了能先train,與其想辦法各種嘗試引導訓練,
抽象地說就是想辦法找一個先驗讓兩個pattern的support能
重合。不如直接一個理論可行的再去處理wgan模型的問題,因
為比較具體有方向。順便說之前的別組也是各種花式加self
-attention在decoder和encoder中也是沒用,至於原因因為
不是我做的我沒去也不想去深思,或許也可以就是~可能有錯
,多包涵啦。
※ 編輯: stmilk (223.137.88.3 臺灣), 11/11/2021 01:46:54
※ 編輯: stmilk (223.137.88.3 臺灣), 11/11/2021 01:56:19
我稍微想到可能比較有創意(?)你可以嘗試的方法。
從sample的特徵下手,而且我會傾向不用up sample因為我不喜歡人工數據XD。
雜訊很多的情況就上面有提到,從sample中隨機取特徵,然後創個新sample。
但因為我的問題是哪些是雜訊也不知道,
所以這樣的好處是資料都是是自然環境產生的,
我不用去考慮這樣取是不是會有bias,反正隨機數拉高一定會逼近我要的樣子。
注意如果特徵彼此之間獨立性高,這樣做會有問題,
依我的經驗我還想不到哪些可能的題目可以用這個XD
然後是特徵少且彼此獨立性高且樣本數也很少的話,
這種的就麻煩因為你的資訊本來就少,大概只能用加雜訊的方式去up sample了,
然後是特徵少且獨立性高然後樣本高,那這樣我會採down sample,
我現在直觀想到就 greedy 地去做。
先根據你的問題,觀察哪個特徵最重要(簡單的方法就隨機森林),
從這個特徵來看聚的狀況,但注意這個聚集狀況可以用不同的方式來定義,
就是用不一樣的距離公式來嘗試,
把這個群體中sample數偏高的類別刪掉一些,
基本假設就是因為這個特徵影響大,
那又特別多的sample聚集在一起的東西可能影響會太大有bias
同樣地你可以反過來從不重要的特徵下手去砍,這樣對整個資料的影響會最小
然後反過來特徵多且獨立性高樣本數多,因為這種狀況可能會有為度災難的可能
所以會特徵一起砍
觀察不重要的特徵的聚的狀況,
直接砍掉這個特徵,並砍掉不平衡的那個地方,然後一直持續到樣本平衡
特徵多且獨立性高樣本少,其實會發現樣本少就是麻煩,
所以我一樣會砍最沒影響往上的特徵,然後觀察從最重要往下的特徵的群,
去砍裏面不平衡的那方
不過樣本數少可能會有問題,我應該還是傾向up sample就是
然後我現在想的到的終極狀況之一是特徵沒有特別的群聚現象,
因為這個太抽象可能個別問題有不同的方法XD
在目前抽象的假設下我只能建議加雜訊 up sample
或是隨機去 down sample
以上你參考一下,但畢竟我不知道你做的題目,
所以我盡量先考慮比較一般只考慮抽象特徵的情況了
但對某些特定題目不一定可行你要小心使用哈哈
最後我上面除了雜訊那個都假設獨立性高,這個可以很簡單地用PCA達成,
所以如果你想要維持原本的特徵,不用獨立性高的假設其實應該差別也不大
對不起我昨天其實滿累得沒注意到你應該就是問樣本數很少還稀疏的情況,
樣本數少的時候方法想得很混。
如果樣本數少,並假設超級極端狀況99%比1%。
一樣觀察特徵附近(注意這個"附近"一樣是根據你的距離定義,根據不同問題是用的距離定義),
因為資訊實在太少,基本只能假設這個樣本附近可能會有同樣的標注。
所以從附近去生成樣本,
如果這個某個標注還在另外一個標注的某個聚落附近,你也可以考慮降低這個聚落的影響,
就是在這個聚落去砍掉多數的樣本。
其實概念上都差不多,就是根據你的問題,看有沒有某些前提資訊可用,然後去resample。
根據你的問題,這個特徵的選法就不同,探討聚落的方式也不同(像是KNN,T-SNE)。
若是你用的是隨機森林的方法,你甚至可以考慮把這個算法啟發化。
其他的方式想啟發化也不是不行,但是就是沒有tree model這麼乾淨俐落就是
以上就是我目前想的到的處理方法哈哈
※ 編輯: stmilk (223.137.88.3 臺灣), 11/11/2021 21:46:44
※ 編輯: stmilk (223.137.88.3 臺灣), 11/11/2021 21:58:18
※ 編輯: stmilk (223.137.88.3 臺灣), 11/12/2021 12:27:45
... <看更多>