世の中おかしいことだらけやな。まとめ マイクロソフトの音声認識システム、「人と同等」レベルに到達!!! やばい・・・ | 世の中おかしいことだらけやな。まとめ

マイクロソフトの音声認識システム、「人と同等」レベルに到達!!! やばい・・・

スポンサーリンク

336

1: スタス ★ 2017/08/24(木) 20:35:58.22 ID:CAP_USER9
マイクロソフトの音声認識システム、「人と同等」レベルに到達
2017年08月24日 13時18分
https://m.japan.cnet.com/story/35106247/

 Microsoftの研究員が開発した音声認識システムが、人間の速記者と同レベルとされる単語誤り率を達成した。

 Microsoftは米国時間8月21日、同社の音声認識システムが、プロの速記者に匹敵するとされる5.1%の単語誤り率に達したと発表した。

IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断

IBM、音声認識の誤り率でMSの記録更新--「人と同等」レベルには未達と判断
 Microsoftは2016年、5.9%の単語誤り率で「ヒューマンパリティ(人間と同程度)」に到達したと考えたが、IBMの研究員らは、そこまでのレベルに達したとするには、IBMの最高記録である5.5%をやや上回る5.1%に達する必要があると主張した。

 IBMが実施した速記者に関する研究では、数人に会話を何回か聞いてもらい、もっとも優秀な速記者の結果が選ばれた。

 Microsoftのシステムは、2016年のテストと同様に、データセット「Switchboard」コーパスを使って測定された。Switchboardコーパスは、見知らぬ者同士が電話越しに米国英語で交わした約2400の双方向の会話から成るデータセットだ。このテストは、スポーツから政治までさまざまなテーマについて交わされた会話を文字化するものだ。

 MicrosoftのテクニカルフェローであるXuedong Huang氏は、次のように述べている。「音響モデリングを改善するため、CNN-BLSTM(Convolutional Neural Network combined with Bidirectional Long-Short-Term Memory:畳み込みニューラルネットワークと双方向長短期記憶の組み合わせ)モデルを追加した。また、複数の音響モデルに基づく予測を組み合わせるアプローチを、フレーム/セノンレベルと単語レベルの両方で取り入れた」

 「さらに、会話セッションの全履歴を使って、会話の次の流れを予測させた。これによって、音声認識システムの言語モデルが強化され、会話のテーマやその場の文脈に有効に適応できるようになった」

 重要な節目を迎えたものの、Microsoftは、さまざまな訛りや話し方を認識するのが機械にはまだ難しく、騒がしい環境ではパフォーマンスが良くないと認めている。

 Microsoftは、文脈を検知して会話をこれまでより正確に文字化するようモデルをトレーニングすることに成功したが、会話の意味を実際に理解するようコンピュータをトレーニングできるまでには、長い道のりがある。

25: 名無しさん@1周年 2017/08/24(木) 21:16:29.05 ID:qxF5c+6K0
>>1
どうせ、人って言っても、ひい婆ちゃんと同等とかでしょ。

40: 名無しさん@1周年 2017/08/24(木) 23:06:42.93 ID:3wxTqmR30
>>1マイクロソフトの音声認識よりスマホのほうが認識率いいと思うけどね。どう考えても。

3: 名無しさん@1周年 2017/08/24(木) 20:37:21.26 ID:kWopJEmx0
青森でもそれ言えるの?

18: 名無しさん@1周年 2017/08/24(木) 20:45:34.98 ID:P0JO9eD40
これで菅野美穂の謎が解けるな

19: 名無しさん@1周年 2017/08/24(木) 21:00:48.60 ID:ihRsrA5J0
3で吹いた

20: 名無しさん@1周年 2017/08/24(木) 21:01:40.67 ID:zZDjQPw/0
「回転数落とし声」が得意な友人が色々挑戦したがっているんだが

21: 名無しさん@1周年 2017/08/24(木) 21:11:18.19 ID:+ipdQZGh0
スレに言論統制かけはじめた?

24: 名無しさん@1周年 2017/08/24(木) 21:15:36.51 ID:S+2fg0sB0
人間以上の聞き取りなんて、別に大したことないと思うわ。
しょっちゅう聞き間違いやってるおれからいうと。

26: 名無しさん@1周年 2017/08/24(木) 21:17:27.56 ID:dC3c6VyB0
人間同士でも聞き間違いなんて日常の事だからね。
認識システムがどれほど進化しようと推して知るレベル。

27: 名無しさん@1周年 2017/08/24(木) 21:37:34.48 ID:W4EJ9OSx0
検索技術に繋いだだけだろ?
だから音声AIと言わず、「音声認識システム」

28: 名無しさん@1周年 2017/08/24(木) 21:37:55.23 ID:BJRDic1j0
でも空耳はするのだろう?

29: 名無しさん@1周年 2017/08/24(木) 21:42:06.24 ID:czuJyezq0
あとは翻訳エンジンやねー

30: 名無しさん@1周年 2017/08/24(木) 21:55:59.44 ID:TNx6bZRV0
googleのも結構聞き分けてるけどな
だがsiriお前はダメだ。二言目には「何を言っているのかよくわかりません」とか言いやがって。
間違いなくこの分野でappleは出遅れている。

31: 名無しさん@1周年 2017/08/24(木) 22:01:35.88 ID:RGDjpfpM0
さらに進化して「人を超えました」とか言い出したりして
人を超えるとどうなるのかはわからないけど。

34: 名無しさん@1周年 2017/08/24(木) 22:18:09.34 ID:9R8jE8ou0

32: 名無しさん@1周年 2017/08/24(木) 22:04:07.92 ID:pKCowPxC0
もう日本のIT企業は蚊帳の外だな

33: 名無しさん@1周年 2017/08/24(木) 22:17:30.70 ID:vOONKVYV0
まだ英語だけでしょ AIのディープラーニングの成果かな

35: 名無しさん@1周年 2017/08/24(木) 22:27:10.24 ID:Hk2HqYl60
ズーズー弁認識してちょ

36: 名無しさん@1周年 2017/08/24(木) 22:51:34.74 ID:kKm4kdaA0
単にテキスト化してるだけ、意味を理解してるわけではない、

37: 名無しさん@1周年 2017/08/24(木) 22:51:53.14 ID:aKPW7hbz0
ムカーシ、NECのN5200で、5人までの音声は認識できると豪語していたが、その後有耶無耶
有耶無耶と言えば、ロボット掃除機を考えていたが、日本では、仏壇のローソクを倒して火事になるから駄目だとなった
形は今のルンバにそっくり
ついでに、有機ELの技術も諦めて韓国企業に売った
ソニーでは、スマホの原型を作っていたようだ

日本の企業は、目先の利益ばかりを追求して、未来へ花開くかも知れない技術やアイディアは潰す傾向が有る

38: 名無しさん@1周年 2017/08/24(木) 23:03:11.30 ID:RKY6v3mm0
日本語は文章解析は難しいかもしれないが
音声認識の点では優位な筈。

日本の研究も先行して欲しい。

39: 名無しさん@1周年 2017/08/24(木) 23:06:38.19 ID:5I5H+XLS0
音声認識はAIと呼べる代物じゃないだろ



引用元

スポンサーリンク      


You Might Also Like

Comment

Leave a Reply





管理者にだけ表示を許可する