HOME | Raspberry Pi | ビジネス書籍紹介 | 2021-09-19 (Sun) Today's Access : 147 Total : 354141. Since 10 Sep. 2019

Text to Speech テキスト読み上げ
2020.03.18

YouTubeでポイントを説明しています。画像をクリックすると再生できます。

今回はテキストの音声読上げ、Text to Speech を行います。
読み上げには、MITライセンスの gTTS (Google Text to Speech)を利用します。
試験環境としては、Raspberry Pi Zero W、ディストリビューションに Raspbian Stretch を使用しています。

■gTTs (Google Text To Speak) のインストール
$ sudo pip3 install gTTS

テキストから音声に変換されたデータは、mp3ファイルとして保存し、メディアプレーヤーにて再生しますので、メディアプレーヤーもインストールします。

■mplayer のインストール
MPlayer(エムプレーヤー)は、オープンソースのメディアプレーヤーです。
参考→I2S通信によるハイレゾ音源再生
$ apt-cache search mplayer | grep mplayer
....
mplayer - movie player for Unix-like systems
....

$ apt-cache show mplayer | more
Package: mplayer
Version: 2:1.3.0-6
Architecture: armhf
......

$ sudo apt-get install mplayer
それでは、外務省の海外向け英語ツイートを音声に変換してみましょう。

$ vi gTTS_en.py
import os
from gtts import gTTS

english='Japan\'s Health Ministry updated its Q&A page. You can find answers to such questions as how you can avoid catching/spreading the virus, what is the "cough etiquette". '
tts = gTTS(english, lang='en')
tts.save("english.mp3")
os.system("mplayer english.mp3")

$ python3 gTTS_en.py

次は、外務省の国内向け日本語ツイートを音声に変換してみましょう。

$ vi gTTS_ja.py
import os
from gtts import gTTS

japanese='日仏首脳電話会談。3月13日,午後6時10分から約30分間,安倍晋三内閣総理大臣は,エマニュエル・マクロン・フランス共和国大統領と日仏首脳電話会談を行いました。'
tts = gTTS(japanese, lang='ja')
tts.save("japanese.mp3")
os.system("mplayer -speed 1.4 -af scaletempo japanese.mp3")

ゆっくり話すようにしたい場合は、
tts = gtts.gTTS(text=english, lang='en', slow=True)
のように指定できます。
日本語テキストから変換された音声は、逆にゆっくりしていて、これを早くする指定は gTTS にはありません。
そこで、メディアプレーヤー側で話す速度を変更しています。
mplayer のオプション設定
-speed xx 再生速度の倍率を指定します 0.01?100
-af scaletempo 音の高低を変えずに再生速度のみを変える

$ python3 gTTS_ja.py

ここで、英語で読み上げた後に、英語テキストを日本語に自動翻訳させて、日本語読み上げをさせることを考えてみます。
翻訳用のpythonパッケージをインストールします。

■py-translator
$ sudo pip3 install py_translator
...
Successfully installed Unidecode-1.1.1 beautifulsoup4-4.6.3 idna-2.8 langdetect-1.0.7 lxml-4.2.5 py-translator-2.1.9 python-slugify-1.2.6 requests-2.21.0 urllib3-1.24.3

$ pip3 show py_translator
Name: py-translator
Version: 2.1.9
....

$ python3
>>> from py_translator import Translator
>>> s = Translator().translate(text='Hello World', dest='ja').text
>>> print(s)
こんにちは世界

では、さらに先ほどの外務省の英語ツイートを翻訳してみます。
>>> english='Japan\'s Health Ministry updated its Q&A page. You can find answers to such questions as how you can avoid catching/spreading the virus, what is the "cough etiquette". '
>>> s = Translator().translate(text=english, dest='ja').text
>>> print(s)
日本の保健省はそのQ&Aページを更新しました。あなたは/キャッチウイルスを拡散を避けることができる方法などの質問に対する答えを見つ けることができ、「咳エチケット」ものです。
>>> ctrl+[D]

現段階での、実装は難しいかもしれません。

ここからは、音声合成をもうちょっと深堀りしたい方向けです。

■日本語音声読み上げ Open JTalk
Open JTalkは、名古屋工業大学を中心に開発されたオープンソースのソフトウェアです。
フリーソフトですが商用利用もできます。

パッケージの検索
$ apt-cache search open-jtalk
open-jtalk - Japanese text-to-speech system
open-jtalk-mecab-naist-jdic - NAIST Japanese Dictionary for Open JTalk

インストール
$ sudo apt-get install open-jtalk open-jtalk-mecab-naist-jdic

男性ボイス: nitech_jp_atr503_m001.htsvoice
$ sudo apt-get install hts-voice-nitech-jp-atr503-m001
$ sudo find / -name nitech_jp_atr503_m001.htsvoice -print
/usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice

女性ボイス: mei_normal.htsvoice
MMDAgentという別プロジェクトから、メイちゃん音響モデル(Voiceデータ)を流用します。
$ wget https://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/
MMDAgent_Example-1.6/MMDAgent_Example-1.6.zip/download -O MMDAgent_Example-1.6.zip
$ unzip MMDAgent_Example-1.6.zip MMDAgent_Example-1.6/Voice/*
Archive:  MMDAgent_Example-1.6.zip
   creating: MMDAgent_Example-1.6/Voice/
   creating: MMDAgent_Example-1.6/Voice/mei/
  inflating: MMDAgent_Example-1.6/Voice/mei/COPYRIGHT.txt
  inflating: MMDAgent_Example-1.6/Voice/mei/mei_angry.htsvoice
  inflating: MMDAgent_Example-1.6/Voice/mei/mei_bashful.htsvoice
  inflating: MMDAgent_Example-1.6/Voice/mei/mei_happy.htsvoice
  inflating: MMDAgent_Example-1.6/Voice/mei/mei_normal.htsvoice
  inflating: MMDAgent_Example-1.6/Voice/mei/mei_sad.htsvoice
  inflating: MMDAgent_Example-1.6/Voice/mei/README.txt
$ sudo cp -r MMDAgent_Example-1.6/Voice/mei/ /usr/share/hts-voice
$ ls /usr/share/hts-voice mei nitech-jp-atr503-m001
OpenJtalkのパラメータ
Option Items  Range  Default 
-x  辞書の指定
-m  音声データの指定
-ow  WAVファイルの指定
-ot  ログファイルの指定 
-a  声質  -0.8~0.8 0.55 
-r  話速 0.5~2.0 1.0  
-fm  音程 -24~24  0.0  
-jf  抑揚  1.0  
-jm  波形増幅? 0.0~  1.0  
  合成テキスト 最大200字  

Open JTalk に日本語テキストを渡し、音声ファイルを生成します。

$ echo 日仏首脳電話会談。3月13日,午後6時10分から約30分間,安倍晋三内閣総理大臣は,エマニュエル・マクロン・フランス共和国大統領と日仏首脳電話会談を行いました。 | open_jtalk -x /var/lib/mecab/dic/open-jtalk/naist-jdic -m /usr/share/hts-voice/mei/mei_normal.htsvoice -r 1.0 -ow japanese.wav

再生します。
$ mplayer japanese.wav

声質、話速、音程、抑揚、波形増幅 のパラメータを変更して試してみてください。

■音響モデル(Voiceデータ)のカスタマイズ
OpenJTalk は自分の声を音響モデルにすることも可能です。
詳細は下記のサイトで詳しく説明しているので参考にしてみてください。
HTS-demoによる自作音響モデルの作り方 その1
HTS-demoによる自作音響モデルの作り方 その2


【参考文献】
Raspberry Pi + Speaker pHat で京急の運行情報を喋らせてみる
py-translator を使ってみる
HMM-based Text-to-Speech System Open JTalk Demonstration Page
OpenJTalk + python で日本語テキストを発話
HTS VOICE
萌え声を探せ!Open JTalkのパラメータをいろいろ変化させてみた!
 Raspberry Pi(ラズベリー パイ)は、ARMプロセッサを搭載したシングルボードコンピュータ。イギリスのラズベリーパイ財団によって開発されている。
2020.01.05 第1回 abcjs 楽譜作成・演奏スクリプト
2020.01.09 I2S通信によるハイレゾ音源再生
2020.01.18 MIDI再生:FM音源YMF825+Arduino編
2020.01.24 FM音源YMF825+micro:bit編
2020.02.13 Piano Hat & Rosegarden
2020.03.18 テキスト読み上げ gTTS
2020.05.19 テキスト読み上げ AquesTalk pico LSI
2020.06.22 波形処理 第1回 音の波と三角関数
2020.07.22 波形処理 第2回 平均律と純正律
2020.08.26 波形処理 第3回 黒鍵と白鍵
2020.11.21 深層学習 第1回環境整備
2020.12.19 深層学習 第2回マルコフ連鎖・自動歌詞生成
2021.01.02 深層学習 第3回コード進行解析
2021.01.16 波形処理 第4回 コード演奏
2021.08.07 MIDI制御/Adafruit Music Maker
2021.08.23 MIDIフォーマット解析
2021.08.24 オーディオアンプ・スピーカー


ニーア オートマタ PLAY ARTS改 <ヨルハ 二号 B型 DX版> PVC製 塗装済み可動フィギュア
「NieR:Automata」より、ヨルハ二号B型こと2BがPLAY ARTS改に新たに登場! 高級感の感じられるコスチュームや髪の質感、洗練されたボディバランス、細かなデティールに至るまでこだわり抜かれた逸品。 DX版には通常版のラインナップに加え2Bの随行支援ユニット ポッド042などをはじめ“純白の美しい太刀"白の約定やエフェクトパーツ、自爆モードを再現できる換装用ボディパーツ、シーンに合わせて変えられる顔パーツ2種も付属する豪華な仕様に。 作中のあらゆるシーンを再現することが可能なファン必見の一品となっている。

DIPスイッチで動作電圧を3.3Vと5Vに切り替えられるUNO互換ボード
KEYESTUDIO Plus Board for Arduino UNO R3 with Type-C USB Cable, 3.3V 5V 1.5A Output Current, More Powerful Controller Board USB-シリアルチップ:CP2102 / 動作電圧:5Vまたは3.3V(DIPスイッチ制御)/ 外部電源:DC 6-15V(9V推奨)/ デジタルI / Oピン:14(D0〜D13)/ PWMチャネル:6(D3 D5 D6 D9 D10 D11)/ アナログ入力チャネル(ADC):8(A0-A7)/ DC出力機能の各I / Oポート:20 mA / 3.3Vポートの出力能力:50 mA / フラッシュメモリ:32 KB(うち0.5 KBはブートローダーによって使用されます)/ SRAM:2 KB(ATMEGA328P-AU)/ EEPROM:1 KB(ATMEGA328P-AU)/ クロック速度:16MHz / オンボードLEDピン:D13

エレクトロクッキー Leonardo R3 ATmega32u4 ボード DIY Arduino工作用 - ピンクエディション


Newtonライト2.0 ベイズ統計
ベイズ統計は,結果から原因を推定する統計学です。AIや医療などの幅広い分野で応用されています。その基礎となるのは18世紀に考えだされた「ベイズの定理」です。 この本では,ベイズ統計学のきほんをやさしく紹介していきます。

Interface 2021年10月号
☆特集:~ 格好良さアップ! 機能&信頼性アップ ! ~「 3Dプリンタ & メカ設計入門 」
☆特集2:Pico達人への道…「 C/C++でMicroPython拡張 」


トランジスタ技術 2021年9月号
☆特集:~ 直流・交流・非接触・センサ微小電流の測定ノウハウ ~「電流を正しく測る技術」

トランジスタ技術スペシャル 2021年7月号 宇宙ロケット開発入門
これから開発・活用が進むと期待されている宇宙空間への交通・物流インフラとして、小型・低価格ロケットが注目を集めています。本書では、基本構造から制御メカニズムまで、小型宇宙ロケット開発の基礎知識を実例を交えて解説します。

日経Linux 2021年9月号
【特集1】おうち時間をLinuxデスクトップで楽しむ! Linux環境を作るワザ
【特集2】徹底図解で丸わかり! 「WSL2」入門   Windows 11の新機能を速報!
【特集3】IT自動化ツール AnsibleでWeb導入を自動化
【特集4】ラズパイで楽しむLinuxライフ 「今、会議中」と家族に伝えるプレートをPythonで作ろう


ラズパイマガジン2021年秋号
特集1 サクッと動くパーツ&ライブラリ総覧
特集2 ArduinoライブラリでラズパイPicoを動かす
特集3 古いラズパイをフル活用! Node-REDで 楽しい電子工作
特集4 空気の汚れをラズパイで検知しよう
特集5 ラズパイで楽しむLinuxライフ
特集6 NVIDIAのAIボードが6000円台に!
特集7 M5StickCで始める電子工作 iPhoneからサーボモーターを制御しよう


トランジスタ技術スペシャル 2021年 4月号 No.154「達人への道 電子回路のツボ」
初学者が実用的な電子回路を設計できるようになるためのポイントをまとめました。学校の教科書だけではつかめない基本電子回路やOPアンプ/トランジスタの使い方の実際を、いろいろな視点から解説しています。


Raspberry Pi 3 Model B V1.2 (日本製) 国内正規代理店品
【仕様概要】CPU:ARM 1.2GHz 4コア、GPU:2コア 3D・動画支援、RAM:1GB、ネットワーク:LAN/Wi-Fi/Bluetooth、インターフェース:USB/HDMI/オーディオ/GPIO(UART/I2C/I2S/SPI...)。

ELEGOO Arduino用 Nanoボード V3.0 CH340/ATmega328P、Nano V3.0互換 (3)


ESPr Developer 32
スイッチサイエンス(Switch Science)

協和ハーモネット UL1007 AWG24 耐熱ビニル絶縁電線 リール巻 100m 黒


白光(HAKKO) ダイヤル式温度制御はんだ吸取器 ハンディタイプ FR301-81


サンハヤト TTW-203 テストワイヤ
ブレッドボードとスルーホール間の接続に便利なワイヤですブレッドボード用のオスピンと基板のスルーホール用のバネ性のある端子を組み合わせたテストワイヤです

無水エタノールP 500mlx2個パック(掃除)


ケイバ(KEIBA) マイクロニッパー MN-A04


熱収縮チューブφ1.5
印字無しで綺麗☆ シュリンクチューブ 絶縁チューブ 防水 高難燃性 収縮チューブ (2m, ブラック(黒))


サンハヤト SAD-101 ニューブレッドボード


白光(HAKKO) HEXSOL 巻はんだ 精密プリント基板用 150g FS402-02


【Amazon.co.jp限定】エーモン 電工ペンチ 全長約255mm (1452)


[Amazon限定ブランド]【指定第2類医薬品】PHARMA CHOICE 解熱鎮痛薬 解熱鎮痛錠IP 100錠


Copyright © 2011-2022 Sarako Tsukiyono All rights reserved®.