0781名無しさん@ピンキー (ワッチョイ cfc0-qDMB)
2026/02/17(火) 02:00:59.95ID:yyVDuzix0・まず音声を認識させる。
・それがどの指示にあたるかを解読する
・それを踏まえて指示に従う
ってフローになると思うけど
1番めと3番めはまあ簡単寄り。
2番めが問題。
まず「指示を分解・理解してそれがどのコマンドに該当するか」を出す必要があるが
「思ってたのと違う」になる可能性が高い。
というかこれやるならローカルモデルが実質必須だが
モデル切り替えと音声認識の時点でかなり時間かかる。
それくらいなら普通にボタン操作で良くない?ってのはある。