今、キーボードや図面タップで入力をしていますよね。
その入力方法がどう変わっていくユーザーインターフェイスのアイデアです。
まず、音声。
こう言うとも音声入力なんて今でもあるだろうといった意見が出る。当然です。
現状ではマイクが他の音を拾ったり、機械が聞き取ってくれないため大きな声を出した他人に迷惑を掛けたり、周囲の騒音に邪魔されたりします。これが嫌われて音声入力は普及してない。ただし静かな環境ではすでに高精度で、会議等の録音からの文字起こしには広く使われている。
では。雑音問題はどうするか。遮音、高精度・高指向性マイク?
違います。
理屈では簡単に解決できるアイデアです。(現状の技術でできるかどうかは私は知りません)
あなたは対面して人と話すとき、顔を見ますね。
コンピューターにもこれをやらせれば良い。
人の顔を認識し、唇を読み、入力された音声と同期させる。
様々な音が入っては来ても、口の動きと同期されない声はその人の声では無いと判断する。普段、誰でもやっていることだ。
また、意識的に横を向いて「お、来たな~」と言っているのは認識しないように設定する。
これで、個人に対する音声入力の仕組みができる。
願わくば声の調子や表情を読んで欲しいが難しそうだ。
返答も画像を合成して音声と同時に流し、会話させる。
「うーん、今日はちょっと肉っぽい物、あと一杯」
これくらいの会話なら現状でも認識して提案できそうだ。
ということで今日はアイデア出しまで。
実現可能/不可能とかあったに教えてください。
あ、マスクょしていると無理かもしれない。