カスタムメイド3Dシリーズ Part327

>>780
・まず音声を認識させる。
・それがどの指示にあたるかを解読する
・それを踏まえて指示に従う

ってフローになると思うけど
1番めと3番めはまあ簡単寄り。
2番めが問題。
まず「指示を分解・理解してそれがどのコマンドに該当するか」を出す必要があるが
「思ってたのと違う」になる可能性が高い。

というかこれやるならローカルモデルが実質必須だが
モデル切り替えと音声認識の時点でかなり時間かかる。

それくらいなら普通にボタン操作で良くない?ってのはある。