日本株式會社PFUとPFU上海計(jì)算機(jī)有限公司が共同開発した【ディープラーニング環(huán)境音認(rèn)識システム】は、IEEEが指定する國際大會DCASE 2018 ChallengeのTask 4のコンテストに參加し、50システムの中で一位を獲得しました。
DCASE 2018 Challengeは、IEEEによって指名されたAASP (Audio and Acoustic Signal Processing) Challengeコンテストの一環(huán)で、IEEEによって公認(rèn)された音聲?音響信號処理の國際的な権威あるコンテストでもあります。Task 4は“Large-scale weakly labeled semi-supervised sound event detection in domestic environments”、つまり“室內(nèi)環(huán)境における大スケール弱ラベル半監(jiān)督音事象検出”です。今年のコンテストの內(nèi)容は與えられた室內(nèi)環(huán)境中の音聲(人の聲、貓や犬の鳴き聲、警報音、掃除機(jī)の音、ひげをそる音、食べ物を揚(yáng)げる音などが含まれる)のうち、何秒目から何秒目までのどのような音があるかを認(rèn)識するものでした。
PFU上海チームはこのコンテストに參加し、北京清華大學(xué)、中國科學(xué)技術(shù)大學(xué)、上海交通大學(xué)など國內(nèi)の名門大學(xué)以外、米ジョンズ?ホプキンス大學(xué)、オーストリア?グラーツ大學(xué)、韓國電子通信研究院、インド工科大學(xué)など海外の研究機(jī)関が參加した同大學(xué)とのコンテストで1位を獲得しました。正解率は2位より2.5%高く、基準(zhǔn)より21.6%高くなっています。
近年ディープラーニング(深層學(xué)習(xí))技術(shù)が急速に進(jìn)展しているため、PFU上海チームは常に最先端技術(shù)の変化に注目し、それらの研究と運(yùn)用を通じて、ニューラルネットワーク技術(shù)について豊富な経験を積んでおり、高い実踐力を備えています。今回のコンテストでは、PFU上海チームはさまざまなニューラルネットワーク技術(shù)に関する長年の研究経験を活かし、音聲処理に最適なニューラルネットワークのアルゴリズムを正確に選び出し、音聲の音響的特徴を抽出する精度を高め、最終優(yōu)勝のための強(qiáng)固な基盤を築き上げた。さらに、従來モデルでは扱うことができなかった弱いラベルデータに、従來モデルでは扱うことができなかった弱いラベルデータを訓(xùn)練するための様々な最先端の新しいモデルに挑戦し、コンテキスト相関技術(shù)によって音響的特徴をさらに強(qiáng)化することで、これらの新しい技術(shù)の応用に新しいブレークスルーをもたらしました。
PFU上海チームは今後もAI分野に深く関與し、挑戦を続け、新たなピークを目指します。