本リポジトリはcoqui-ai/TTSとROSの接続を可能にし,リアルタイムの高度な音声合成を提供する.
最新の TTSv2
は16ヶ国語に対応し,全体的にパフォーマンスが向上している.
(上に戻る)
ここで,本レポジトリのセットアップ方法について説明する.
(上に戻る)
まず,以下の環境を整えてから,次のインストール段階に進んでください.
System | Version |
---|---|
Ubuntu | 20.04 (Focal Fossa) - Local Env. |
Python | >= 3.9, < 3.12 |
Docker Engine | 26.0.0 (動作確認済) |
CUDA | >=11.8 (GPU使用の場合) |
Note
本レポジトリを使用するには, Docker が必要である.
(上に戻る)
- ROSの
src
フォルダに移動します.$ roscd # もしくは,"cd ~/catkin_ws/"へ移動. $ cd src/
- 本レポジトリをcloneします.
$ git clone https://github.com/TeamSOBITS/coqui_tts_ros
- レポジトリの中へ移動します.
$ cd coqui_tts_ros/
- 依存パッケージをインストールします.
$ bash install.sh
- パッケージをコンパイルします.
$ roscd # もしくは,"cd ~/catkin_ws/"へ移動. $ catkin_make
- TTSサーバーを簡単に実行するために,
alias
を作成する.- CPUのみの場合:
$ echo "alias tts_launch='docker run --rm -it -p 5002:5002 -v ~/{PATH_ROS_WS_LOCAL}/src/coqui_tts_ros/models/:/root/.local/share/tts/ --entrypoint \"tts-server\" ghcr.io/coqui-ai/tts-cpu'" >> ~/.bash_alias
- GPUの場合:
$ echo "alias tts_launch='docker run --rm -it -p 5002:5002 --gpus all -v ~/{PATH_ROS_WS_LOCAL}/src/coqui_tts_ros/models/:/root/.local/share/tts/ --entrypoint \"tts-server\" ghcr.io/coqui-ai/tts'" >> ~/.bash_alias
Important
{PATH_ROS_WS_LOCAL}
はローカル環境に存在するROSのワークスペースのPATHである.
Important
すでに,Dockerのコンテナーの中にいる場合,ローカル環境上でコマンド6を実行する必要がある.
(上に戻る)
- ローカル環境上でTTSサーバーを立ち上げる.
- CPUのみの場合:
$ tts_launch --model_name tts_models/en/vctk/vits
- GPUの場合:
$ tts_launch --model_name tts_models/en/vctk/vits --use_cuda true
Note
--model_name
を更新することが可能です.
そのためにmodel_list.yamlを参照してください.
-
TTSの起動する機能をパラメタとし tts.launchに設定する.
<!-- Set Coqui TTS server url --> <arg name="url" default="http://localhost:5002"/> <!-- Add period at the end of a sentence (true) --> <arg name="addStopChar" default="true"/> <!-- Set result sound filename --> <arg name="filename" default="output.wav"/> <!-- Set input style_wav if sample voice is given --> <arg name="style_wav" default=""/> <!-- Set Speaker ID if multi-speaker model is being used --> <arg name="speaker_id" default="p225"/> <!-- Set Language if multi-language model is being used --> <arg name="language_id" default=""/> <!-- Set sound_audio to true if you want to play the sound --> <arg name="sound_audio" default="true"/>
-
tts.launchというlaunchファイルを実行する.
$ roslaunch coqui_tts_ros tts.launch
(上に戻る)
-
--model_name
をパラメータとして設定できるようにする. -
style_wav
の機能を導入する.
現時点のバッグや新規機能の依頼を確認するためにIssueページ をご覧ください.
(上に)
(上に戻る)