aamall

音声認識

2018年08月03日

音声を自動でテキスト化

AIを用いた音声認識によって、会話を正確にテキスト化できるようになりました。

正確さで一番大事なのは、日本語の音を発した通りに拾われることです。アナウンサーのように聞き取りやすい声でなくとも、正確に拾えるようになってきました。また最近では、方言などによるアクセントの違いも識別できるようになっています。

人が使いやすい状態を目指すならば、次に漢字へ正しく変換されることが大事になります。ひらがなだけの文章では当然読みにくいからです。また、全く同じ発音で意味の異なる言葉も、意味の流れから正しい漢字へ変換されるようになっています。

正確さが高まったことで、会議や定例記者会見で話した内容の自動生成に使われることが増えてきました。それによって作成時間を大幅に短縮できます。

正確さ、つまり音声の忠実なテキスト化の精度が向上するだけでも、活用の幅が広がるわけです。その正確さをベースにして、内容を要約するシステムが組み合わさるなど、より便利になっていきます。

(本郷理一)




robotbusiness at 09:00|Permalink

2018年04月13日

複数から成る音を分離する技術

音声認識技術が多く使われるようになっていますが、周囲の環境によっては正しく機能しない場合があります。周りの音が複数であったり、音量が大きかったりした場合などです。

そのために必要な機能が、複数の音の中から認識したい音のみを取り出す技術です。しかし従来の技術では、精度が実用的ではありませんでした。

また、認識する対象である音声単体を機械にあらかじめ覚えさせる必要がありました。その音声を覚えることで、周囲の他の音と区別ができたわけです。

しかし、この工程が必要なく、かつ精度の高い技術が登場してきています。ディープラーニングを活用する技術で、対象の音声を覚えるのではなく、音声の区別の仕方を学ぶことで認識が可能になります。

音声の区別の仕方を学ぶには、学習用のデータが必要になります。このデータの種類を変えれば、人の声以外の音も取り出すことができます。

例えば、この技術を車のカーナビに搭載することで、会話や走行音、音楽が混在していても、自分の声がしっかりと認識してもらえるわけです。

このように、音声認識が雑音の多い環境下でも正しく機能するには必要不可欠な技術です。

(本郷理一)



robotbusiness at 09:00|Permalink

2018年03月20日

音声のテキスト化技術で議事録を自動生成

AIを用いた音声認識によって、会話を正確にテキスト化できるようになりました。

正確さで一番大事なのは、日本語の音を発した通りに拾われることです。アナウンサーのように聞き取りやすい声でなくとも、正確に拾えるようになってきました。また最近では、方言などによるアクセントの違いも識別できるようになっています。

人が使いやすい状態を目指すならば、次に漢字へ正しく変換されることが大事になります。ひらがなだけの文章では当然読みにくいからです。また、全く同じ発音で意味の異なる言葉も、意味の流れから正しい漢字へ変換されるようになっています。

正確さが高まったことで、会議や定例記者会見で話した内容の自動生成に使われることが増えてきました。それによって作成時間を大幅に短縮できます。

正確さ、つまり音声の忠実なテキスト化の精度が向上するだけでも、活用の幅が広がるわけです。その正確さをベースにして、内容を要約するシステムが組み合わさるなど、より便利になっていきます。

(本郷理一)



robotbusiness at 09:00|Permalink

2018年01月18日

音声認識をだます音声

音声認識技術は話し言葉を文字に変換して、その意味を認識する技術です。Siriや、新しいものであればAIスピーカーなど、その技術は様々なところで使われるようになりました。

しかし、認識される音声に特殊な加工を施すことで、全く異なる認識をさせることが可能なことが判明しました。音声認識をするAIの特性を利用した技術で、聞こえる内容とは違う内容を認識させることができます。話し言葉だけでなく音楽などにも、AIしか反応しない音声を付け加えることもできるそうです。加工後の音声は少し荒れる程度で、まさかそんなことがされているとは気づきもしません。

この技術はセキュリティの問題につながるわけですが、他のセキュリティ問題との大きな違いは、音声認識技術自体には何の悪さもしていないということです。ウイルスを送り込んでシステムを改変したわけでもなく、むしろ正常に機能していることで悪用されてしまうということです。

この技術が直接被害をもたらすというよりは、きかっけに使われることが懸念されます。例えば、悪意のある、それこそウイルスが仕込まれたサイトに接続されてしまうなどです。実際にこういった悪用を成功させることは難しそうです。AIスピーカーを遠くから悪用しようとしても、そもそも近くでないため認識すらしません。一方、対策が取りづらいのも事実です。実際に、機械は音声を認識するが、人間には聞こえない音なども存在します。

(本郷理一)



robotbusiness at 09:00|Permalink

2017年09月21日

AI音声アシスタントが生活を変える

人とロボットが共生する生活を考えたとき、私は真っ先に「人とロボットの会話」を思い浮かべます。

会話をするためにロボットに求められるものは音声認識と自然言語処理です。
これらの技術が進歩したことで、対話ができるロボットが増えました。

今回は対話ロボットがどのように人の生活を変えていくのかについてです。
ロボットはアシスタントとしての機能を果たせると思います。
「AIアシスタント」と言われていたりします。
特にAI音声アシスタントとは、ユーザーの音声を通じて指示や要求を把握し、様々なタスクを実行するサービスのことです。
声一つで、人の操作・行動を代替してくれるということになります。

例えば、IoT製品の操作(スチッチのオン・オフなど)。
声がリモコンになるわけです。
また、インターネット上で人がやっていた操作(検索など)。
忙しい朝でも、人が食事や着替えをしている最中に、ロボットが天気やニュースを教えてくれて、タクシーの手配や乗り物の予約を代わりにしてくれる。

もちろんAIによる音声認識技術には課題が多いです。
例えば、周囲の環境音や人の話し方の違いによって起きる誤認識をなくすことや、AIに言葉を理解させることなどがあげられます。

しかし、技術は日々進歩しています。
「キーボード・マウス操作」から「タッチ操作」という流れの先は、「音声操作」かもしれません。

(本郷理一)



robotbusiness at 10:00|Permalink
管理人プロフィール
日本ロボコム代表
学生起業家
本郷理一(ほんごう・りいち)

大学で建築を学びながら、日本ロボコム株式会社の設立に加わる。
また、「ロボット住宅」に関わる新会社の設立準備を行う。
合わせて、単なるビジネスを超えたソーシャルイノベーターの道を探る。
「ロボットビジネス勉強会」の月例会で「ロボットビジネスセミナー」の講師を務めている。
応援クリック
いつもおつきあいくださり、ありがとうございます。
皆さまに応援していただくと大きな励みになります。

ギャラリー
  • 超高精度AI自動翻訳|第10回ロボットビジネス勉強会
  • 超高精度AI自動翻訳|第10回ロボットビジネス勉強会
  • 第10回ロボットビジネス勉強会参加者募集
  • 第10回ロボットビジネス勉強会参加者募集
  • 第6回ロボットビジネス勉強会参加者募集
  • スマートロボティクスが登場
  • スマートロボティクスが登場
  • 月刊ロボットビジネスVol.3発行
  • 月刊ロボットビジネスVol.3発行