SOBITS TTSは様々なText to Speech (TTS)をROS2のAction通信に対応させ,まとめたものです.
現在以下のTTSに対応しています.
- Kokoro TTS
- Coqui TTS
- Piper TTS
- Supertonic TTS
- Voicevox TTS
- Open JTalk, SVOX Pico TTS
- Parler TTS
- Open Audio TTS
(上に戻る)
ここで,本レポジトリのセットアップ方法について説明します.
(上に戻る)
まず,以下の環境を整えてから,次のインストール方法に進んでください.
| System | Version |
|---|---|
| Ubuntu | 24.04 (Noble Numbat) |
| ROS | Jazzy Jalisco |
| Python | 3.12 |
(上に戻る)
-
ROS2の
srcフォルダに移動します.cd ~/colcon_ws/src/
-
本レポジトリをcloneします.
git clone -b jazzy-devel https://github.com/TeamSOBITS/sobits_tts.git
-
レポジトリの中へ移動します.
cd sobits_tts/ -
依存パッケージをインストールします.
bash install.sh
-
パッケージをコンパイルします.
cd ~/colcon_ws/
colcon build --symlink-install
source ~/colcon_ws/install/setup.sh
(上に戻る)
実行する前に,使用するTTSのモデルをダウンロードする必要があります.
各TTS名をクリックするとダウンロードと実行方法を閲覧できます.
| TTS名 | 精度 | 生成速度 | 特徴 |
|---|---|---|---|
| Kokoro | ☆☆☆☆ | ☆☆☆☆ | 英語・日本語などに対応 |
| Coqui | ☆☆☆☆ | ☆☆☆☆ | 英語のみに対応 |
| Piper | ☆☆☆ | ☆☆☆☆☆ | 日本語以外の多言語対応,超軽量・CPUでも高速動作 |
| Supertonic | ☆☆ | ☆☆☆☆☆ | 英語,韓国語,フランス語など5カ国語に対応,非常に軽量 |
| Voicevox | ☆☆☆☆ | ☆☆☆☆ | 日本語のみに対応.ずんだもんで発話可能 |
| OpenPico | ☆ | ☆☆☆☆☆ | 英語・日本語に対応 |
| Parler | ☆☆☆☆ | ☆ | 英語・日本語などに対応,感情指定が可能なモデルあり |
| OpenAudio | ☆☆☆☆☆ | ☆ | 英語・日本語などに対応,音声クローン,感情指定可 |
| パラメータ | 説明 | デフォルト値 |
|---|---|---|
| speaker_volume | スピーカー出力音量をパーセンテージで設定する.プログラム終了後は元の音量に戻る.例: "150%" |
"" |
Note
speaker_volume は現在,生成したWAVデータをソフトウェア的に増幅する方式ではなく,
起動時のデフォルト出力シンクに対して pactl set-sink-volume を使って音量を変更する方式です.
サーバ起動後にGUIで出力先を変更した場合は,起動時に取得したシンクの音量を管理・復元します.
(上に戻る)
現時点のバグや新規機能の依頼を確認するためにIssueページをご覧ください.
(上に戻る)