語音情感辨識,可辨識喜怒哀樂的語氣

Emotional Speech Analysis Based on Convolutional Neural Networks

Yi-Chin Kao, Chung-Ting Li, Tzu-Chiang Tai, and Jia-Ching Wang

摘要

在最近的研究中,語音情感辨識已成為人類行為分析中一個有趣且具有挑戰性的研究領域,該研究領域的目標是根據人們的語氣對人們的情緒狀態進行分類。

目前,研究領域的重點是辨識語音情緒自動分類器的有效性,以提高實際應用中的分類效率,例如用於電信服務,識別積極情緒,如:高興、驚訝;消極情緒,如:悲傷、憤怒、厭惡和恐懼,可為平台用戶和電信業務客戶提供大量有效數據。

在本文中,使用深度學習技術研究了辨識人類語音數據中積極和消極情緒的複雜任務,5 個開放的情感語音數據集用於訓練用於正面和負面情緒辨識的多級模型,實驗結果表明,我們的模型對於正面和負面情緒語音數據都能獲得良好的結果。

返回頂端