Macだけで話しかけて答えをもらえている。
まーうちの2013Mid MBAなんかではなくて、いまどきMacなんだろうけど
GoogleのAIは賢くて画像のcaptchaも結構認識できちゃうよね。で、Chrome拡張機能つくって使っています。https://chrome.google.com/webstore/detail/autocaptcha/npgklhnojgnokoapbmkcafdodkkklgmd
YouTubeにぶちこめば 無料で字幕つけてくれるけどね。UIがうりなのかな? 個人でも利用可能な月額1500円(税別)から
35ドルの「Raspberry Pi」で機械学習を試してみたいと考えている人にとって、現在はこれまでにないほど多くのオプションが用意されている。 GoogleはPiで音声認識と画像認識を実行するためのキットをいくつか提供しており、Piの機械学習機能の実行を高速化するUSBスティックの準備も進めている。 Googleは先頃、同社の機械学習ソフトウェアフレームワーク「TensorFlow」をPiで正式にサポートし、同ボードの機械学習機能の信頼性をさらに高めた。 本記事では、Piで機械学習を始めてみたい人が知っ
株式会社日立製作所(以下、日立)は18日、野村證券株式会社の電話機の通話録音データを対象に、大規模な音声テキスト化システムを構築したと発表した。全国約160カ所の営業店や本社で利用する、約2万6000台の電話機が対象で、日立の音声認識技術を活用して膨大な通話録音データを自動でテキスト変換することにより、顧客との応対品質向上と、通話モニタリングの効率化を支援するとしている。
Intelは、世界各地を移動しながら人工知能(AI)機能を持ったデバイスを利用したい人たちに向けた新しいガジェットを発表した。 「Intel Neural Compute Stick 2」(Intel NCS 2)は、同社のAIチップ「Movidius Myriad X」を、コンピュータに挿入できるUSBアクセサリに組み込んだ製品だ。Intelでモノのインターネット(IoT)業務を担当するゼネラルマネージャーのSteen Graham氏によると、価格は99ドルで、2017年にIntelがリリースした最初の
ニュース 4K/HDRとAlexa対応の「Fire TV Stick 4K」は6,980円。Dolby VisionやHDR10+ - 臼田勤哉 2018年10月3日 22
JALはクラウドベースの音声認識サービス「アレクサ(Amazon Alexa)」を搭載した、スマートスピーカーの新モデル「Amazon Echo Spot」のサービスを開始すると発表。
スマートフォンやタブレットに話し掛けると、通勤経路の混雑予報や夕食のレシピ、荷物の再配達予約など、必要な情報やサービスを、最適なタイミングで提供してくれる――。そんなAIエージェント「my daiz(マイデイズ)」を2018年5月に発表したNTTドコモ(以下、ドコモ)は、その仕組みとして大量の顧客情報を集約・分析する「AIエージェント基盤」をAWSで構築し、運用している。 当初、「大量の顧客情報を外部のクラウドに乗せるなんて、全く話にならなかった」という同社が、なぜ、あえてAWSというクラウドをシステム構
バンダイは6月4日、AI(人工知能)搭載の対話型ロボット「ガンシェルジュ ハロ」の予約受け付けを7月下旬に始めると発表した。本体価格は14万9040円(税込)。別途サーバ利用料が掛かるが、初回発売月から12カ月間は無料の予定。 AI(人工知能)搭載の対話型ロボット「ガンシェルジュ ハロ」 バンダイナムコグループが取り組む「BN・Bot PROJECT」の第1弾として、アニメ「機動戦士ガンダム」に登場するペットロボットを再現した。ガンダムの知識を豊富に持ち、ユーザーに質問したり、うんちくを語ったり、クイズを
by Recklessstudios Amazon EchoやGoogle Homeといったスピーカー型端末を使う人も増え、音声認識AIは人々の日常になじんできています。一方、ここ2年間でアメリカや中国の研究チームは「ユーザーに認識されることなくスマート・スピーカーに命令する」ということが可能であることを示し、その技術を開発してきました。この技術を利用すればスマートフォンやスマートスピーカーに搭載されたAIをひっそりとアクティベートし、電話をかけさせたり特定のウェブサイトを開かせたりが可能になります。また
Amazonが販売するスマートスピーカー「Amazon Echo」に搭載されている音声認識アシスタントが「Alexa」です。Alexaは「音楽を再生して」や「歌をうたって」といった具合に、人間がお願いするように話しかけるかたちで使用する音声認識アシスタントなのですが、子どものユーザーが礼儀正しく成長できるように、「お願い」や「ありがとう」といった言葉をかけられるとAlexaからほめ言葉が返ってくる機能が新たに追加されます。
米Googleは11日(現地時間)、騒音のある中で複数人が会話をしているような動画のなかから、特定の人の音声だけを分離する技術を開発したと発表した。
今日(米国時間4/9)、Googleは数週間前に公開したクラウド・テキスト音声変換サービスのAPIにメジャーアップデートを行ったことをを発表した。Googleは同時に逆方向のサービスである音声テキスト変換のクラウド音声認識APIにも大きな改善を行った。Googleのテストによれば、新しいAPIは認識エラーを全体で54%減らしたという。ただし一部のケースでは改善はこれをはるかに上回った。
アップデートされた音声テキスト変換APIを利用するとデベロッパーは 複数のユースケースをベースにした機械学習モデルから
Voicebot.aiが発表した最新のレポートによれば、現在、アメリカの成人4730万人が音声認識可能なスマートスピーカーにアクセスできるという。発売後わずか2年で成人における普及率は20%に達した。
ここで「スマートスピーカーにアクセスできる」というのは、その家庭に少なくとも1台のスマートスピーカーがあるという意味だ。必ずしもスマートスピーカーを所有している、あるいは主たるユーザーであるということは意味しない。つまり同居する家族全員、ルームメイトなどもユーザー数にカウントされている。
この点は他の情
Nuanceが2011年に買収した指なぞり入力モバイルキーボードの「Swype」の提供を終了する。企業向け音声認識・音声入力サービスに集中するためとしている。
ディープラーニングは、大量のデータを学習するため、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。既に音声認識や画像処理に適用され、さらに自然言語処理への応用も進みつつある。
Docomoが音声認識や合成のAPI公開しているのね~