Skip to content

TeamSOBITS/sobits_tts

Repository files navigation

JA | EN

Contributors Forks Stargazers Issues License

SOBITS TTS

目次
  1. 概要
  2. セットアップ
  3. 実行・操作方法
  4. マイルストーン

概要

SOBITS TTSは様々なText to Speech (TTS)をROS2のAction通信に対応させ,まとめたものです.

現在以下のTTSに対応しています.

  • Kokoro TTS
  • Coqui TTS
  • Piper TTS
  • Supertonic TTS
  • Voicevox TTS
  • Open JTalk, SVOX Pico TTS
  • Parler TTS
  • Open Audio TTS

(上に戻る)

セットアップ

ここで,本レポジトリのセットアップ方法について説明します.

(上に戻る)

環境条件

まず,以下の環境を整えてから,次のインストール方法に進んでください.

System Version
Ubuntu 24.04 (Noble Numbat)
ROS Jazzy Jalisco
Python 3.12

(上に戻る)

インストール方法

  1. ROS2のsrcフォルダに移動します.

    cd ~/colcon_ws/src/
  2. 本レポジトリをcloneします.

    git clone -b jazzy-devel https://github.com/TeamSOBITS/sobits_tts.git
  3. レポジトリの中へ移動します.

    cd sobits_tts/
  4. 依存パッケージをインストールします.

    bash install.sh
  5. パッケージをコンパイルします.

    cd ~/colcon_ws/
    colcon build --symlink-install
    source ~/colcon_ws/install/setup.sh

(上に戻る)

実行・操作方法

実行する前に,使用するTTSのモデルをダウンロードする必要があります.

各TTS名をクリックするとダウンロードと実行方法を閲覧できます.

TTS名 精度 生成速度 特徴
Kokoro ☆☆☆☆ ☆☆☆☆ 英語・日本語などに対応
Coqui ☆☆☆☆ ☆☆☆☆ 英語のみに対応
Piper ☆☆☆ ☆☆☆☆☆ 日本語以外の多言語対応,超軽量・CPUでも高速動作 
Supertonic ☆☆ ☆☆☆☆☆ 英語,韓国語,フランス語など5カ国語に対応,非常に軽量 
Voicevox ☆☆☆☆ ☆☆☆☆ 日本語のみに対応.ずんだもんで発話可能 
OpenPico ☆☆☆☆☆ 英語・日本語に対応
Parler ☆☆☆☆ 英語・日本語などに対応,感情指定が可能なモデルあり
OpenAudio ☆☆☆☆☆ 英語・日本語などに対応,音声クローン,感情指定可

共通パラメータ

パラメータ 説明 デフォルト値
speaker_volume スピーカー出力音量をパーセンテージで設定する.プログラム終了後は元の音量に戻る.例: "150%" ""

Note

speaker_volume は現在,生成したWAVデータをソフトウェア的に増幅する方式ではなく, 起動時のデフォルト出力シンクに対して pactl set-sink-volume を使って音量を変更する方式です. サーバ起動後にGUIで出力先を変更した場合は,起動時に取得したシンクの音量を管理・復元します.

(上に戻る)

マイルストーン

現時点のバグや新規機能の依頼を確認するためにIssueページをご覧ください.

(上に戻る)

About

text to speech package for ROS2, TTS

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors