GoogleのAIは賢くて画像のcaptchaも結構認識できちゃうよね。で、Chrome拡張機能つくって使っています。https://chrome.google.com/webstore/detail/autocaptcha/npgklhnojgnokoapbmkcafdodkkklgmd
株式会社日立製作所(以下、日立)は18日、野村證券株式会社の電話機の通話録音データを対象に、大規模な音声テキスト化システムを構築したと発表した。全国約160カ所の営業店や本社で利用する、約2万6000台の電話機が対象で、日立の音声認識技術を活用して膨大な通話録音データを自動でテキスト変換することにより、顧客との応対品質向上と、通話モニタリングの効率化を支援するとしている。
by Recklessstudios Amazon EchoやGoogle Homeといったスピーカー型端末を使う人も増え、音声認識AIは人々の日常になじんできています。一方、ここ2年間でアメリカや中国の研究チームは「ユーザーに認識されることなくスマート・スピーカーに命令する」ということが可能であることを示し、その技術を開発してきました。この技術を利用すればスマートフォンやスマートスピーカーに搭載されたAIをひっそりとアクティベートし、電話をかけさせたり特定のウェブサイトを開かせたりが可能になります。また
Amazonが販売するスマートスピーカー「Amazon Echo」に搭載されている音声認識アシスタントが「Alexa」です。Alexaは「音楽を再生して」や「歌をうたって」といった具合に、人間がお願いするように話しかけるかたちで使用する音声認識アシスタントなのですが、子どものユーザーが礼儀正しく成長できるように、「お願い」や「ありがとう」といった言葉をかけられるとAlexaからほめ言葉が返ってくる機能が新たに追加されます。
米Googleは11日(現地時間)、騒音のある中で複数人が会話をしているような動画のなかから、特定の人の音声だけを分離する技術を開発したと発表した。
今日(米国時間4/9)、Googleは数週間前に公開したクラウド・テキスト音声変換サービスのAPIにメジャーアップデートを行ったことをを発表した。Googleは同時に逆方向のサービスである音声テキスト変換のクラウド音声認識APIにも大きな改善を行った。Googleのテストによれば、新しいAPIは認識エラーを全体で54%減らしたという。ただし一部のケースでは改善はこれをはるかに上回った。
アップデートされた音声テキスト変換APIを利用するとデベロッパーは 複数のユースケースをベースにした機械学習モデルから
Voicebot.aiが発表した最新のレポートによれば、現在、アメリカの成人4730万人が音声認識可能なスマートスピーカーにアクセスできるという。発売後わずか2年で成人における普及率は20%に達した。
ここで「スマートスピーカーにアクセスできる」というのは、その家庭に少なくとも1台のスマートスピーカーがあるという意味だ。必ずしもスマートスピーカーを所有している、あるいは主たるユーザーであるということは意味しない。つまり同居する家族全員、ルームメイトなどもユーザー数にカウントされている。
この点は他の情
Nuanceが2011年に買収した指なぞり入力モバイルキーボードの「Swype」の提供を終了する。企業向け音声認識・音声入力サービスに集中するためとしている。
ディープラーニングは、大量のデータを学習するため、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。既に音声認識や画像処理に適用され、さらに自然言語処理への応用も進みつつある。