テクノロジーで障害が障害でなくなる?!音声文字化アプリ開発責任者インタビュー|後藤佑季

2021年1月13日
写真:ヘッドフォンをしているEve Andersson女史と、リモートで質問をする後藤リポーター。音を文字で表示しているスマートフォンの画面。

2020年―
本来なら東京大会が開催されるはずだったこの1年は、マスクが日常になったり、仕事や学校もオンライン化が進んだり、コロナ禍で様々なことが大きく変化した年になりました。

私のような聴覚障害者は、特にその変化によって「困りごと」が顕著になりました。
たとえば、マスクによって、読唇や表情を読み取ることが難しくなりました。
その一方で、今まで理解してもらいにくかった「困りごと」を理解してもらえるようにもなりました。

なぜなら、聞こえる人たちからも「聞こえにくい」「コミュニケーションを取りづらい」と感じることが以前よりも増えた、という話を聞くからです。

今、私の聞こえ方としては、マスクをしている人の声が、すごくこもったような感じになりました。
ビニールシートやアクリル板が、自分と相手との間に入るようになり、マスクの中から出た音がさらに遮蔽(しゃへい)されています。声が口から出て、耳に入るまでに、2重に障害物が挟まっている上に、ソーシャルディスタンスを取らなければいけなくなり、ただでさえ聞こえにくくなっている環境でさらに声が届きにくくなっています。

誰もがコミュニケーションをしやすくなることが、“パラリンピックの目指す共生社会”への第一歩では?と思い、改めて今、「コミュニケーション」について考えようと、この記事を書くことにしました。


聴覚障害はコミュニケーションの障害と言われますが、私が一番苦労しているのが、「雑談」が聞き取ることができないこと。
難聴者は、ある程度の話はわかるけれど、途中の一部分が聞き取れなかった、ということが往々にしてあります。その一部分を知ることができると、細かいニュアンスまでわかるのですが、「ある程度」聞き取れているが故に、話を止めてまで聞き返すのは、ためらわれることが多いのです。

そんな時、「会話を文字にしてくれる装置」があれば、といつも思います。「そういうアプリ、前からあるんじゃない?」と言われるのですが、変換に時間がかかったり、誤変換が多かったりなど、リアルタイムの会話ではなかなか頼れない…という感じでした。
変換の精度が高く、タイムラグが少ないものは難しいのだろうな…と半分諦めかけていたのですが、日本や世界で「音声文字変換」の研究は様々な企業や研究機関で行われ、そしてコロナ禍で進歩していることを知りました。

写真:「今年のお正月休みは何をしてたの?」という文字が表示されているスマートフォン

そうしたアプリの1つを開発した、アメリカに本拠を置く国際的なIT企業の担当者に、オンラインで取材をする機会を得ました。この会社で開発しているアクセシビリティー機能には、視覚障害者向けのカメラで捉えた風景の読み上げ機能や、発声が困難な人向けの音声認識機能などがあります。
今回、お話を伺ったのはこのチームを統括するディレクターである、Ms. Eve Anderssonです。

写真:ヘッドフォンをするMs. Eve Andersson

音声文字変換&音検知通知アプリ「Live Transcribe」を開発したGoogle アクセシビリティー機能開発チーム統括ディレクター Ms. Eve Andersson

―どんなきっかけで「音声文字化」のアプリを開発することになったのでしょうか?

そのきっかけは、私たちの会社にいるディミトリ・カネフスキーという聴覚障害(ろう)の研究者が作りました。30年間、音声認識の仕事に関わってきたメンバーです。彼は職場で会議があるときには、そこでのメンバーのやりとりが理解できるよう、必ずCARTという字幕入力システムを設置するよう頼んでいたんです。ただ、これは、事前に用意しないといけないものなので、廊下で同僚とばったり出会ったときに立ち話をしたり、同僚とランチをしたりしながらおしゃべりをするのには使い難いものでした。

ろうのディミトリ氏と、友人でエンジニアのチャット氏が、会話をするたびに(普段使いのものからさらに)特別な機械を準備しなくてもいいよう、誰でも持っているスマートフォンで文字化ができるものを作ろうとしたと言います。
このアプリは、スマートフォンであらかじめ立ち上げておくと、マイクで拾った会話の音声をクラウドに送り、そこで文字化の処理をして再びスマホに送って画面に表示するという仕組みになっています。クラウド上の変換技術には、同社が検索分野で蓄積した膨大な「ことば」のデータが用いられ、変換の精度とスピードの向上につながっているのだそうです。

―アプリの開発は、開発者チームに障害当事者がいるからこそ、という部分も大きいと思いますが、それは障害のある人を外部から招いて意見を聞くのとはまた違うのではないでしょうか?

大きな違いがあったと思います。チーム自体に多様な視点が必要なのです。例えば、私たちのチームには聴覚障害者、視覚障害者、認知障害者、運動障害者がいますし、健常者もいます。このように様々な人が関わることでユーザー体験や商品そのものが向上すると思っています。

障害当事者が現場にいることによって生まれた機能の一つに、サウンドアラート機能(=音を検知して通知する機能)があります。これは、聴覚障害のある社員が、言葉を文字に変換するだけでなく、犬が吠えている、ドアをノックする音などの音を通知するのも重要だと考えたからだと言います。

写真:「音楽」「笑い声」「赤ちゃん」「ピアノ」などのタブ表示がされているスマートフォン画面

この音声文字化アプリを私も実際に使ってみて、会話の「声」だけではなく、その後ろでしている「音」も表現されることに新鮮さを感じました。これまで何かの音が鳴っているのはわかるけど、何の音だろう?と思うことが多々あったのですが、例えば「音楽」「笑い声」「犬の鳴き声」などと画面の下に文字とアイコンで表示されるのです。これは、聴覚障害者が開発したからこその発想だと感じました。

―他社と比較して、“ならでは”の機能などあったりするのでしょうか?

商品を他社のものと比較することはありませんよ。また、アクセシビリティーの仕事をしていると、他社と競争しているという感覚がありません。障害がある人たちのために世界をより良い場所にしていくという共通のゴールがあるので、常に他の会社とコラボレーションしているのです。ライバル関係にはありません。

これは、開発したこの企業の理念である「世界中の情報を整理し、世界中の人がアクセスできて使えるようにすること」が関係しているといいます。社会の中の立場や障害のあるなしに関わらず、すべての人が、(情報に)アクセスする権利があると考えているそうです。

―Eveさん自身もそうした信念がおありなのでしょうか?

私は、世界中の人に公平な機会が与えられるべきだと信じてきました。家族にも障害のある者がいましたが、彼らはすばらしい人間でしたし、世界中で皆と同じ権利を持てるべきだと考えてきました。彼らに公平な機会が与えられるよう、自分にできることは何でもやるのが私の使命となったのです。

―とはいえ、音声文字化のアプリの開発の過程で苦労したこともあったのではないでしょうか?

ええ、すべての人に合う解決策というのはないと思います。なぜなら、障害の種別や障害の程度の重さが違いますし、障害の外からの見え方、また好みも違います。だからこそ私たちは、ろう者や難聴の人のための大学であるギャローデット大学(※)と連携したのです。音声文字化のアプリはディミトリだけのためでなく、幅広い人たちに使ってもらうために開発したのです。

(※アメリカ・ワシントンにある、ろう・難聴学生のための教養課程(liberal arts)大学)

写真:モニターにインタビューを行っている後藤リポーター

―わたしは、「テクノロジーで障害は障害でなくなる」部分は少なからずあると思っています。その考えについてはどうお考えでしょうか?

あなたの質問は非常に重要だと思います。障害のある人たちの多くは、自分の周りの人たちが使っているのと同じものを使いたいと思っています。ですから、皆が使っているデバイスの中にAIの能力を搭載させることで、障害のある人たちはこれまでのように自分は人とは違うと思ったり、障害があることに引け目を感じたりすることが減るはずです。

ただ、同時にテクノロジーがすべての解決策にはならないと思っています。だからこそ、皆の認識を変えるためにも、あなたのような人が活躍する必要があるのです。人の態度や偏見―「障害者にはできないことがある」という考えですね―をもっている人たちがいますが、テクノロジーを活用すれば「障害があってもできる」ことを示すことで、偏見を少しですが解消することはできるでしょう。
(テクノロジーを開発研究できる)私たちが社会に対してメッセージを発信することで、人々が自分たちの持つ偏見を自覚して、その偏見を変えていくよう促す必要もあるのです。

―テクノロジーは、例えばわたしのつけている人工内耳のように、障害のある人とない人の架け橋になると思っているのですが、どう思いますか?

ステキな発想ですね。架け橋になるとおっしゃいましたが、それは「障害の社会モデル」という考え方にぴったりと当てはまります。すなわち障害というのは、障害者に問題があるのではなく、障害のある人たちがうまく機能できない「社会」の方に問題があることなのですが、テクノロジーが架け橋となって、そのギャップを埋めることができるはずです!

ほかにもいろいろなテクノロジーが、障害を障害でなくしていく…と思いますが、どれだけテクノロジーが進歩しても、最終的には人の心が変わらないといけないのだと今回のインタビューを通じて強く思いました。
でも、人の心が変わるのは簡単ではありません。その手助けを、テクノロジーがしてくれるのでしょう。

他にも、こうした「音声を文字化する」機能を使ったさらなる「テクノロジーによって障害が障害でなくなる」取り組みを取材しているので、またお伝えしますね!

キーワード

後藤佑季 バリアフリー
後藤佑季

後藤佑季(ごとう・ゆうき)

1996年7月30日生まれ 岐阜県出身 聴覚障害(人工内耳使用) 【趣味・特技】料理、カメラ、書道準五段、手話技能検定準2級 【スポーツ歴】陸上(100m走など短距離)、水泳、バドミントン 【抱負】私の聴覚障害(難聴)のような『目に見えない障害』の存在を伝え、様々な障害のある人とない人との橋渡し役になれたらと思っています。自分の身体ではないものを最大限に生かし、自らの可能性を広げる、超人たちの「常識を超える瞬間」を多くの方にお伝えしていきたいです!

おすすめの記事