一天搞懂深度學習 深度學習(英語:deep learning)是機器學習的分支,是一種以人工神經網路為架構,對資料進行表徵學習的演算法。 深度學習是機器學習中一種基於對資料進行表徵學習的演算法。觀測值(例如一幅圖像)可以使用多種方式來表示,如每個像素強度值的向量,或者更抽象地表示成一系列邊、特定形狀的區域等。而使用某些特定的表示方法更容易從實體中學習任務(例如,臉部辨識或面部表情辨識)。深度學習的好處是用非監督式或半監督式的特徵學習和分層特徵提取高效演算法來替代手工取得特徵。
表徵學習的目標是尋求更好的表示方法並建立更好的模型來從大規模未標記資料中學習這些表示方法。表示方法來自神經科學,並鬆散地建立在類似神經系統中的資訊處理和對通訊模式的理解上,如神經編碼,試圖定義拉動神經元的反應之間的關係以及大腦中的神經元的電活動之間的關係。
至今已有數種深度學習框架,如深度神經網路、卷積神經網路和深度置信網路和遞迴神經網路已被應用在電腦視覺、語音辨識、自然語言處理、音訊辨識與生物資訊學等領域並取得了極好的效果。
深度學習也只要三個步驟:建構網路、設定目標、開始學習,說穿了就是這麼簡單。人類大腦的神經網路是由(神經元)組成的,AI人工智慧運用最常使用的一種,模仿生物神經網路的結構和功能,所產生的數學模型,用於對函式進行評估或近似運算。
假如有一個方程式F(x)叫從台北到高雄,這個函數的變數是 x = 交通工具,那麼無論我們輸入的是高鐵、飛機、汽車或腳踏車等,最後的結果都 = 台北到高雄。 在現實的社會沒有這麼簡單,就像深度學習的類神經網路一樣,我們可以在這個函數裡加進各種變數,如方程式F(x,y,z)叫從台北到高雄最有效率,這個函數的變數是 x = 交通工具,y =時間,z=費用,經過變數x,y,z交叉分析,經過一層又一層的運算之後,最後到底要用什樣交通工具、時間、費用的運算後,就是這個函數集建議的最佳決策。
有些函數集更複雜,需要很久的時間才能看到結果。在程式設計裡,有高速運算的機器很快看到結果,還可以告訴機器,這個效率不夠好,可以調整函數種不同的變因,是否有更好的成果。這個過程,就是所謂的「學習」,經過大量的訓練過程,最終機器就能找到一個最佳函數,得出最佳解。
究竟神經網路是什麼?