<大演算:機器學習的終極演算法將如何改變我們的未來,創造新紀元的文明?>
原文作者:Pedro Domingos
譯者:張正苓,胡玉城
出版社:三采
出版日期:2016/08/05
這本書非常新,是今年夏天才出版的,用簡單扼要卻又引人入勝的方式介紹了機器學習的歷史發展、五大主要流派各自的觀點和限制,並且提出一個「大演算」(The Master Algorithm)的概念,期許且預言,各理論流派將會進行整合,形成一個The Master Algorithm,並且對我們的未來產生廣泛而深遠的影響。
本書內容淺顯易讀,對於稍有資訊背景的人來說並不會很難懂,能稍有統計或類神經網路的知識又更好一些。
本書提到的五大流派,是指:
1. 符號理論:
數學上,我們習慣將現實的問題轉化成符號,用符號進行邏輯推演,再將推演的結果拿到現實中去驗證。決策樹(decision tree)就是一種將事實化成邏輯符號的例子。
2. 類神經網路:
顧名思義是模擬人腦神經元運作模式的一種技術。將每一神經元化為一個節點,節點之間層層相連(數學上來說是以權重做線性加成,再以一個激活函數對輸出結果做調整)的一種學習器。
此領域在1960年代曾將風光一時,研究者一開始認為可以用它來解決所有複雜問題,最後卻發現它甚至無法解決像是XOR這種簡單、但線性不可分離(Non-linear separable)的問題。
現今隨著deep learning技術發展起來,類神經網路理論亦死灰復燃。這個流派最大的缺點就是無法對它所學習到的東西(也就是各層的weight)進行物理上的解釋,而僅僅是一堆數字,同時也很容易overfitting,但他們在實務上可以取得良好的正確率。
3. 演化論:
遺傳演算法模擬生物學上染色體交配、突變、適者生存的法則,利用電腦母程式產生大量子程式,對不適者加以淘汰,以留下最好的學習法則。
4. 貝氏定理:
簡單貝氏定理(Naïve Bayes)非常基礎卻非常實用,適用性非常廣。一言以蔽之,它試圖用過去的經驗(prior)和目前的事實來預測未來發生的機率(postier)。諷刺的是,它雖然簡單,卻常常比一些複雜的學習法得到更好的成效。這是機率統計的威力所在。
5. 類比推理:
這個流派應用的例子如knn演算法、SVM(支持向量機),藉由數據資料彼此之間的相似性(similarity)作為分類的判斷依據。
最後它提到機器學習的未來展望。作者認為,機器學習雖會偷走人類的工作,但同時也為人類創造更多的工作。人類可以利用機器學習對現實需求便宜行事,而花費更多心力在以人為本的問題上。
沒有留言:
張貼留言