一番ネックになるのはボイスだろうなとは思う
1単語につき1ボイスの差分なしだろうから、どう組み合わせても声色が一本調子な感じになるんじゃないかと
やっぱボイスの外部取り込み機能が欲しい、IPスレでも言ったがボイロと組み合わせたい