一文讀懂深度學習與機器學習的淵源

深度學習是機器學習的一個子集,都是人工智慧的子集。

機器學習與深度學習不完全屬於一個拳擊淘汰賽中,深度學習是機器學習的一個子集,而它們都是人工智慧(AI)的子集。但是,在機器學習和深度學習的定義和用例方面,市場上存在很多混淆,現在讓我們來澄清一下混淆。

·人工智慧(AI)是模擬和模仿計算機系統和機器中的智能人類行為的研究。

·機器學習是AI的一個子領域,它使用演算法將AI概念應用到計算系統中。計算機識別並根據數據模式採取行動,隨著時間的推移學習提高其準確性,無需明確的編程機器學習背後的分析,如預測編碼、集群和視覺熱圖。

·深度學習是機器學習的一個子領域,是人工神經網路的另一個名稱。深度學習計算機網路模擬人類大腦感知、組織和從數據輸入的方式。撇開天網,深度學習今天依然是存在的。

Advertisements

機器學習與深度學習

通常人們對於機器學習與深度學習的想法可能會忽略一點,如前所述,深度學習是機器學習的一個子集。在這一點上,你更有可能在應用程序中使用機器學習,而不是深度學習,但它仍然是一個發展中的技術,而且部署起來很昂貴。現在有些產品已經上市了,隨著時間的推移,人們會發現深度學習將變得更加普遍。

我們來看兩者之間的區別和使用情況。

機器學習

作為人工智慧的一個子集,機器學習使用演算法來解析數據,從結果中學習,並運用學習來做出決定或預測。示例包括聚類、貝葉斯網路和可視化數據映射。例如,在電子檔案資料查詢和合規性調查中,熱圖和視覺集群可以將圖形搜索結果呈現給人類,他們可以使用結果深入到其他模糊的數據中。

Advertisements

機器學習技術分為兩類:監督機器學習和無監督機器學習。監督式學習取決於人為生成的種子集合,教導軟體如何定義數據。預測編碼就是一個很好的例子。該軟體指的是將數據模式匹配到相關度百分比的種子集。隨著時間的推移,預測編碼工具從持續進行的審閱反饋中學習。

無監督機器學習取決於識別數據中包含的模式並將其與其他數據或搜索查詢進行比較。機器學習演算法隨著數據集的增長和更多模式的出現而隨時間學習。無監督機器學習包括集群、概念搜索和接近重複數據刪除。

例如,聚類匹配文檔之間相似的文本和元數據,並將數據呈現在可視化集群中。概念搜索通過識別和匹配概念來擴展基於文本的查詢。近似重複數據刪除比較類似的數據,並根據相似程度排除文檔,而電子郵件線程將孤立的電子郵件鏈接到相應的線程。這些分析中的每一個都從其行動中學習,以提高性能和準確性。

機器學習基礎設施差異很大,單個系統可以實現有限的集群或網路流量報告,而大型系統則包含數十台伺服器和大規模并行處理(MPP)架構,用於跨多個數據源的海量數據。

深度學習

深度學習(也稱為人工神經網路)基於所有機器學習演算法。但是,它不使用數據分類等任務特定的演算法。相反,它通過識別來自非結構化輸入的代表性數據,並輸出準確的行動和決定來模擬人類的大腦結構和功能。

學習可以被監督或不受監督,這意味著大的神經網路可以接受標記的輸入,但不需要它。學習程序教會神經網路如何構建不同的處理層,當網路處理輸入時,他們根據數據輸入和輸出創建自己的層。這種深度學習的水平允許神經網路自動從原始數據中提取特徵而無需額外的人力輸入。

神經網路由多個簡單連接的處理器(稱為神經元)組成,這些神經元是為模仿人腦中的神經元而創建的數學函數。這些人造神經元組成了神經網路的單元。

簡單地說,每個神經元接收兩個或更多的輸入,處理它們,並輸出一個結果。一些神經元接收來自外部感測器的輸入,而另一些神經元則被來自其他活動神經元的輸入激活。神經元可能激活額外的神經元,或者可能通過觸發動作影響外部環境。所有活動都是在自創的隱藏層中進行的,每個連續的圖層都會輸入前一層的輸出。

實際上,神經網路攝取非結構化數據:聲音、文本、視頻和圖像。網路將數據分成數據塊併發送給單獨的神經元和層進行處理。一旦這個離散的處理完成,網路產生最後的輸出層。

大規模的可擴展性是神經網路的關鍵。神經網路的性能取決於它可以攝取、訓練和處理多少數據;數據越多意味著效果越好。這是另一個區別於更基本的機器學習,其演算法通常在一定水平上平穩。深度學習只是通過其計算資源來限制其性能。因此,神經網路的「深層」部分:計算資源越多,層次越深,產出越廣泛。儘管深度學習不是那麼快捷和容易,但更低的計算處理能力使研發工作發生了革命性的變化。

機器學習和深度學習的常用用例

重要的是要記住機器學習的用例已經在市場上了。深度學習的用例主要是現階段的發展目標,商業化程度有限。一些用例是相似的:區別在於神經網路可以增長到接近無限的學習和輸出規模。機器學習更受約束,適合具體的實際計算任務。另外請記住,它們兩個不是相互排斥的。

地區

機器學慣用例

深度學慣用例

營銷,合規

電子郵件和社交媒體的情緒分析使用文本線索來提醒情緒狀態。

情緒分析可以識別照片和視頻中的實時情緒。應用程序根據人的情緒反應傳送動態內容或視覺顯示。

汽車

基於感測器信息的無人駕駛汽車。

基於視覺模式識別的無人駕駛汽車,比如立即識別消防栓和行人的區別。深度學習還可以通過檢測波形中的發動機聲音來啟動汽車缺陷檢測。

監測

監控分析系統是基於規則的,通過用戶生成的定義和規則分析饋送。

這些系統基於行為分析。它觀察詳細的視覺線索,並教導自己什麼行為是觀察對象的正常行為。聯網的深度學習系統也可以識別來自不同時間和地點的照片和視頻的相同面孔。

生命科學,醫學

用戶編程演算法來識別糖尿病人群中的變數並預測個體患者的風險因素。

通過識別視覺標記物識別MRI掃描中的癌症標記物,獨立於人類程序員或診斷者。

語音識別

機器學習使語音識別能夠隨著時間的推移向用戶學習。這個過程是訓練密集的,平均95%的準確率。

神經網路處理數十億個口語音,將語音識別提高到接近100%的準確度,同時縮短訓練時間。語音識別還通過關鍵詞和主題對原始音頻進行分類,並識別出發言者,這對音頻監控有著廣泛的影響。

娛樂

大規模的CGI使用機器學習來幫助自動化密集的視覺效果,如插入數字人群或可視化巨大的空間爆炸。

深度學習使媒體和遊戲能夠在用戶輸入、動作和/或表達式的響應中動態地繪製動畫。

展望機器學習和深度學習的未來

你不會在每個街角都找到深度學習/人工神經網路的身影。他們普遍需要大量的標記數據進行監督學習,或大量的非結構化數據進行無監督學習。深度學習技術開發人員需要花費大量的時間標記和向神經網路輸入數據,或者需要輸入數以百萬計的非結構化對象來實現無監督學習。

在今天的數據密集型世界中,擁有足夠的數據不是問題。標記足夠的數據,或將足夠的未標記數據引入神經網路是一個挑戰。儘管處理能力不斷增加,價格也有所下降,但密集計算仍然需要對系統和支持進行大量的投資。

儘管如此,深度學習在許多不同的業務垂直領域都有很好的用例。像谷歌和Facebook這樣的公司正在投入深度學習來開發這些實際的應用程序,而其他開發者也在跟風。

Advertisements

你可能會喜歡