はじめに
これはテキスト音声合成ソフトウェア「VOICEVOX」の使い方を紹介するドキュメントです。
最初に利用規約をご確認ください。
また、使い方を軽めに紹介した動画もあるので、よかったらご覧ください。
起動方法
Windows 版
起動しようとすると「Windows によって PC が保護されました」というダイアログが表示されるかもしれません。その際は「詳細情報」をクリックし、「実行」を選んでください。
→ 
Mac 版
初回起動時は Apple に登録されていないアプリケーションとして警告ダイアログが表示されるかもしれません。

その際は Finder で、Control キーを押しながら VOICEVOX アプリケーションアイコンをクリックし、ショートカットメニューから「開く」を選択してから、「開く」をクリックしてください。
もしくは、アップルメニューから「システム環境設定」を選択して「セキュリティとプライバシー」 をクリックし、「一般」パネルで「このまま開く」選んでください。
Apple Silicon 搭載の Mac をお使いの場合
初めて VOICEVOX を機動する際に Rosetta のインストールを促される場合は、案内に従ってインストールしてください。
音声合成エンジンの起動
最初に音声合成エンジンが起動します。
メモリが 3GB 以上の NVIDIA 製 GPU をお持ちの方は、音声の生成がずっと速い GPU モードを快適にご利用いただけます。
※Mac 版では GPU モードに対応していないため GPU モードはご利用頂けません。
音声の生成
キャラクターアイコンの右にある空白をクリックしてテキストを入力してみてください。
エンターボタンを押して文章を確定すると、画面の下の方に読みとアクセントが表示されます。(1回目は反映まで数秒ほど時間がかかることがあります。)
再生ボタンを押すと音声が生成され、音声が再生されます。
文章の追加・削除
右下の+ボタンを押すとテキスト欄が増え、複数の文章を並べることができます。
キャラクターの変更
テキスト入力欄の左にあるアイコンをクリックすると、テキストを読み上げてくれるキャラクターを変更することができます。
キャラクターの表示順序は「キャラクター並び替え」で変更できます。
テキスト欄の並び替え
テキスト欄周辺をドラッグすることで、テキスト欄の順番を並び替えられます。
単語の接続変更
意図しない箇所で単語が分離していた場合や、意図しない形で結合してしまっている場合は、アクセント項目で文字の間をクリックすることで修正できます。
例えば「ディープラーニング」がこのように分かれてしまった場合は、
2つの隙間をクリックすると
このように1語にまとめることができます
逆に切り離したい場合は、文字の間をクリックして切り離すことができます。
アクセントの変更
音声の抑揚が意図しないものだった場合に、抑揚を変える方法が2つあります。まずはアクセント箇所を変えてみることをおすすめします。
アクセント箇所を変えるには、読みの上にあるバーを左右に動かします。
例えば「ディープラーニング」を「↑ ディープラ ↓ アニング」と読んでほしい場合は、「ラ」の位置まで丸をスライドします。
→ 
イントネーションの変更
アクセントを変更してもうまく行かなかったときや、抑揚をより拘りたいときに、文字ごとの音の高さ(イントネーション)を直接変更することができます。
「イントネーション」をクリックして現れる縦線のバーを上下させることで抑揚を表現できます。
イントネーション調整スペースを縦に広くすることで、より細かく抑揚を調整することもできます。
マウスホイールで調整することもできます。Ctrl キーを押しながらマウスホイールを使うと更に細かく調整できます。
また、「キ」や「ツ」や「ス」などが無声化されている場合、バーが灰色になっています。イントネーション欄のテキストをクリックすることで無声化を解くことができます。
→ 
無声化できるものはイ行とウ行だけです。
読みの修正
読みが思っているものと違う場合は、アクセント欄で読みをクリックすることで後から修正することもできます。テキスト欄と同様に、ひらがなや句読点、漢字も入力できます。
スタイルの変更
キャラクターによっては複数のスタイル(喋り方)を変えることができます。キャラクターの変更と同様に、テキスト欄左のアイコンから選択できます。
キャラクターを選択したときに適用されるスタイルは、設定の「デフォルトスタイル」で変更できます。
音の長さの変更
文字ごとに、音の長さを変えることが可能です。語尾を少し伸ばしたい、無音の長さを調整したいときなどに便利です。
「長さ」をクリックして現れる縦線のバーを上げるとその音を長く、下げると短くできます。
右のバーが母音、左のバーが子音に対応しています。
音声ファイルの書き出し
メニュにある「ファイル」の「音声書き出し」ボタンを押すと、全テキスト欄の音声が WAV ファイルとして書き出されます。
ファイル保存時、ファイル名は [何行目]_[キャラ名]_[テキスト冒頭].wav
として保存されます。設定でテキストファイルも一緒に書き出すこともできます。
テキストファイルの読み込み
読み込みボタンを押すとテキストファイルを読み込めます。テキストは改行または半角コンマ(,)で区切ることで分割できます。また、キャラクター名だけで区切ることで、そのキャラクターとして読み込むことができます。
例えばこのようなテキストを読み込むと、
四国めたん,おはようございます,こんにちは
ずんだもん,こんばんは
四国めたん,さようなら
このように読み込まれます。
プロジェクトファイルの保存・読み込み
入力したテキストやキャラクター、アクセント修正やイントネーションの調整結果は、プロジェクトファイルとして保存し、ソフトウェアを起動し直した後で読み込むことができます。プロジェクトファイルの拡張子は.vvproj
です。
ショートカットキー
「設定」の「キー割り当て」で変更することができます。
- 上下キー
- Space
- Shift + Enter
- Shift + Delete
- Ctrl + S
- Ctrl + E
- Ctrl + Z
- Ctrl + Y
- Esc
- 1
- 2
- 3
- スライダーの上でマウスホイール
- スライダーの値を変更します(スライダー →
)
- Ctrl キーを押しながらマウスホイールを使うと更に細かく調整できます
- Alt キーを押しながらイントネーションや長さを調整することで、同じアクセント区間内を同時に調整できます
ツールバーのカスタマイズ
画面上部にあるツールバーのボタンの種類や配置を変更することができます。
キャラクターの並び替え・試聴
「設定」の「キャラクターの並び替え」で、キャラクターの表示順序を変更することができます。
また、キャラクターごとのサンプルボイスを試聴することもできます。
デフォルトスタイル
「設定」の「デフォルトスタイル」で、キャラクターごとのデフォルトのスタイルを変更することができます。
読み方&アクセント辞書
難しい単語や新しい単語は正しい読みにならないことがありますが、辞書機能を使って読み方を登録しておくことができます。
辞書機能は「設定」の「読み方&アクセント辞書」で利用できます。
読み方&アクセント辞書画面を開くと、左に登録した単語のリストが表示されます。
「追加」ボタンで新規に単語を登録できます。
「単語」に登録したいテキストを、「読み」にそのテキストの読み方をひらがなかカタカナで入力してください。
「アクセント調整」で自然になるアクセントを登録できます。
オプション
「設定」の「オプション」でいろいろな設定を変更することができます。
「エンジン」項目
エンジンの起動モードの起動モードを変更できます。
GPU モードを利用するには、3GB 以上のメモリがある NVIDIA 製 GPU が必要です。
「操作」項目
パラメータの引き継ぎ
テキスト欄を追加する際、和速や抑揚といったパラメータを引き継ぐようになります。
再生位置を追従
再生中の単語が画面内に収まるよう、自動的にスクロールして追従するようになります。
「保存」項目
文字コード
読み込み・書き込み用の文字コードを選択できます。
書き出し先を固定
音声ファイルを書き出すディレクトリを固定し、毎回ディレクトリを選択しなくても同じディレクトリに書き出し続けるようにします。
上書き防止
同じファイル名のファイルがあった場合に連番として保存します。
txt ファイルを書き出し
テキスト内容を一緒に保存します。
lab ファイルを書き出し
リップシンクなどに便利な、音声の音素情報とそのタイミング情報が書かれたラベルファイルを一緒に保存します。
「高度な設定」項目
音声をステレオ化
音声をモノラルからステレオに変換して再生・保存します。
再生デバイス
音声を再生するデバイスを変更できます。
音声のサンプリングレート
音声のサンプリングレートを変更して再生・保存します。
サンプリングレートを高くしても音声の品質は上がりません。
「実験的機能」項目
開発中で未完成な便利機能を利用することができます。
プリセット機能
話速や抑揚などのパラメータをまとめて登録できる機能です。
ソフトウェアが終了しても設定したプリセットは残ります。
疑問文自動調整
疑問文のときに自動的に語尾の音を上げて、疑問文っぽい音声を生成するようになります。
「データ収集」項目
ソフトウェア利用状況のデータ収集を許可する
各 UI の利用率などのデータを送信して VOICEVOX の改善に役立てます。
入力されたテキストデータや音声データの情報は収集しておりませんのでご安心ください。
その他
右上のピンボタンでウィンドウを最前面に固定できます。
ヘルプ
利用規約などを確認することができます。
アンインストール方法
Windows 版
インストーラー版でインストールした場合、インストールしたディレクトリの中にある Uninstall VOICEVOX.exe を実行してください。
ZIP ファイルを解凍した場合、ダウンロードした ZIP ファイルと、展開したディレクトリを消去すればアンインストール完了です。
Mac 版
インストーラー版でインストールした場合、「アプリケーション」ディレクトリにある VOICEVOX を「ゴミ箱」にドラッグ&ドロップしてください。
ZIP ファイルを解凍した場合、ダウンロードした ZIP ファイルと、展開したディレクトリを消去すればアンインストール完了です。
よくあるご質問
Q&A をご参照ください。
ご感想・ご要望・バグ報告など
ご感想・ご要望は、ぜひ Twitter にてハッシュタグ #VOICEVOX
を付けてツイートしてください。開発の励みになります。
うまく動かない場合や不具合を見つけられた方は、Twitter にて不具合をハッシュタグ #VOICEVOX
を付けてツイートしていただくか、VOICEVOX 公式(@voicevox_pj)までご報告ください。
その他、 Q&A に掲載されていないご質問があれば VOICEVOX 公式(@voicevox_pj)にお問い合わせください。