Skip to content

TeamSOBITS/coqui_tts_ros

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

JP | EN

Contributors Forks Stargazers Issues

Coqui TTS for ROS

目次
  1. 概要
  2. 環境構築
  3. 実行・操作方法
  4. マイルストーン
  5. 参考文献

概要

本リポジトリはcoqui-ai/TTSとROSの接続を可能にし,リアルタイムの高度な音声合成を提供する. 最新の TTSv2 は16ヶ国語に対応し,全体的にパフォーマンスが向上している.

(上に戻る)

セットアップ

ここで,本レポジトリのセットアップ方法について説明する.

(上に戻る)

環境条件

まず,以下の環境を整えてから,次のインストール段階に進んでください.

System Version
Ubuntu 20.04 (Focal Fossa) - Local Env.
Python >= 3.9, < 3.12
Docker Engine 26.0.0 (動作確認済)
CUDA >=11.8 (GPU使用の場合)

Note

本レポジトリを使用するには, Docker が必要である.

(上に戻る)

インストール方法

  1. ROSのsrcフォルダに移動します.
    $ roscd
    # もしくは,"cd ~/catkin_ws/"へ移動.
    $ cd src/
  2. 本レポジトリをcloneします.
    $ git clone https://github.com/TeamSOBITS/coqui_tts_ros
  3. レポジトリの中へ移動します.
    $ cd coqui_tts_ros/
  4. 依存パッケージをインストールします.
    $ bash install.sh
  5. パッケージをコンパイルします.
    $ roscd
    # もしくは,"cd ~/catkin_ws/"へ移動.
    $ catkin_make
  6. TTSサーバーを簡単に実行するために, alias を作成する.
    • CPUのみの場合:
    $ echo "alias tts_launch='docker run --rm -it -p 5002:5002 -v ~/{PATH_ROS_WS_LOCAL}/src/coqui_tts_ros/models/:/root/.local/share/tts/ --entrypoint \"tts-server\" ghcr.io/coqui-ai/tts-cpu'" >> ~/.bash_alias
    • GPUの場合:
    $ echo "alias tts_launch='docker run --rm -it -p 5002:5002 --gpus all -v ~/{PATH_ROS_WS_LOCAL}/src/coqui_tts_ros/models/:/root/.local/share/tts/ --entrypoint \"tts-server\" ghcr.io/coqui-ai/tts'" >> ~/.bash_alias

Important

{PATH_ROS_WS_LOCAL}ローカル環境に存在するROSのワークスペースのPATHである.

Important

すでに,Dockerのコンテナーの中にいる場合,ローカル環境上でコマンド6を実行する必要がある.

(上に戻る)

実行・操作方法

  1. ローカル環境上でTTSサーバーを立ち上げる.
    • CPUのみの場合:
    $ tts_launch --model_name tts_models/en/vctk/vits
    • GPUの場合:
    $ tts_launch --model_name tts_models/en/vctk/vits --use_cuda true

Note

--model_name を更新することが可能です. そのためにmodel_list.yamlを参照してください.

  1. TTSの起動する機能をパラメタとし tts.launchに設定する.

    <!-- Set Coqui TTS server url -->
    <arg name="url"         default="http://localhost:5002"/>
    <!-- Add period at the end of a sentence (true) -->
    <arg name="addStopChar" default="true"/>
    <!-- Set result sound filename -->
    <arg name="filename"    default="output.wav"/>
    <!-- Set input style_wav if sample voice is given -->
    <arg name="style_wav"   default=""/>
    <!-- Set Speaker ID if multi-speaker model is being used -->
    <arg name="speaker_id"  default="p225"/>
    <!-- Set Language if multi-language model is being used -->
    <arg name="language_id" default=""/>
    <!-- Set sound_audio to true if you want to play the sound -->
    <arg name="sound_audio" default="true"/>
  2. tts.launchというlaunchファイルを実行する.

    $ roslaunch coqui_tts_ros tts.launch

(上に戻る)

マイルストーン

  • --model_name をパラメータとして設定できるようにする.
  • style_wav の機能を導入する.

現時点のバッグや新規機能の依頼を確認するためにIssueページ をご覧ください.

(上に)

参考文献

(上に戻る)

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published