文章來源:http://www.ithome.com.tw/news/97202
機器學習加上人的判斷才是最佳解
以機器學習技術判斷歌曲所能營造的情緒為例,歌曲同樣要經過特徵擷取的過程。在進入機器學習演算法階段之前,需要先用程式分析每首歌的節拍、音調以及節奏等特徵,並把這些特徵轉為數學向量形式的樣本,並由專家對這些樣本下標籤,標記樣本對應歌曲所代表的情緒,並由機器學習演算法找出向量中每個屬性與情緒的關聯度。
因此只要根據訓練出來的歌曲情緒分析模型,比對節拍、音調以及節奏等特徵,電腦就能判斷出歌曲的情緒。但蔡怡仁說,由於判斷歌曲情緒是一個困難的任務,甚至連專家判讀都有機會犯錯更何況是電腦。像是電腦常把悲傷的歌誤判成快樂的,因次他們會有專家負責檢查這些由電腦所做出的判斷,經重新判讀並修正樣本後,再重新將這些樣本輸入機器學習演算法中重新訓練,經過一次一次這樣的樣本修正後,電腦判斷的精確度才會越來越準。
蔡怡仁認為,機器學習是要來解決大量資料分類以及即時推薦的問題。同樣以判斷歌曲情緒的功能為例,Kkbox總共有2,000萬首歌,雖然電腦判斷的正確率只有7成左右,再加上將機器學習應用在音訊分析上的複雜度非常高,不過比起用人工標記的人力與時間成本,在權衡之下機器學習的效益還是瑕不掩瑜。
機器學習加上人的判斷才是最佳解
以機器學習技術判斷歌曲所能營造的情緒為例,歌曲同樣要經過特徵擷取的過程。在進入機器學習演算法階段之前,需要先用程式分析每首歌的節拍、音調以及節奏等特徵,並把這些特徵轉為數學向量形式的樣本,並由專家對這些樣本下標籤,標記樣本對應歌曲所代表的情緒,並由機器學習演算法找出向量中每個屬性與情緒的關聯度。
因此只要根據訓練出來的歌曲情緒分析模型,比對節拍、音調以及節奏等特徵,電腦就能判斷出歌曲的情緒。但蔡怡仁說,由於判斷歌曲情緒是一個困難的任務,甚至連專家判讀都有機會犯錯更何況是電腦。像是電腦常把悲傷的歌誤判成快樂的,因次他們會有專家負責檢查這些由電腦所做出的判斷,經重新判讀並修正樣本後,再重新將這些樣本輸入機器學習演算法中重新訓練,經過一次一次這樣的樣本修正後,電腦判斷的精確度才會越來越準。
蔡怡仁認為,機器學習是要來解決大量資料分類以及即時推薦的問題。同樣以判斷歌曲情緒的功能為例,Kkbox總共有2,000萬首歌,雖然電腦判斷的正確率只有7成左右,再加上將機器學習應用在音訊分析上的複雜度非常高,不過比起用人工標記的人力與時間成本,在權衡之下機器學習的效益還是瑕不掩瑜。