HOME | Raspberry Pi | ビジネス書籍紹介 | 2024-04-26 (Fri) Today's Access : 1017 Total : 920677. Since 10 Sep. 2019

Text to Speech テキスト読み上げ
2020.03.18 / 2022.02.05更新

YouTubeでポイントを説明しています。画像をクリックすると再生できます。

今回はテキストの音声読上げ、Text to Speech を行います。
読み上げには、MITライセンスの gTTS (Google Text to Speech)を利用します。
試験環境としては、Raspberry Pi Zero W、ディストリビューションに Raspbian Stretch を使用しています。

■gTTs (Google Text To Speak) のインストール
$ sudo pip3 install gTTS

テキストから音声に変換されたデータは、mp3ファイルとして保存し、メディアプレーヤーにて再生しますので、メディアプレーヤーもインストールします。

■mplayer のインストール
MPlayer(エムプレーヤー)は、オープンソースのメディアプレーヤーです。
参考→I2S通信によるハイレゾ音源再生
$ apt-cache search mplayer | grep mplayer
....
mplayer - movie player for Unix-like systems
....

$ apt-cache show mplayer | more
Package: mplayer
Version: 2:1.3.0-6
Architecture: armhf
......

$ sudo apt-get install mplayer
それでは、外務省の海外向け英語ツイートを音声に変換してみましょう。

$ vi gTTS_en.py
import os
from gtts import gTTS

english='Japan\'s Health Ministry updated its Q&A page. You can find answers to such questions as how you can avoid catching/spreading the virus, what is the "cough etiquette". '
tts = gTTS(english, lang='en')
tts.save("english.mp3")
os.system("mplayer english.mp3")

$ python3 gTTS_en.py

次は、外務省の国内向け日本語ツイートを音声に変換してみましょう。

$ vi gTTS_ja.py
import os
from gtts import gTTS

japanese='日仏首脳電話会談。3月13日,午後6時10分から約30分間,安倍晋三内閣総理大臣は,エマニュエル・マクロン・フランス共和国大統領と日仏首脳電話会談を行いました。'
tts = gTTS(japanese, lang='ja')
tts.save("japanese.mp3")
os.system("mplayer -speed 1.4 -af scaletempo japanese.mp3")

ゆっくり話すようにしたい場合は、
tts = gtts.gTTS(text=english, lang='en', slow=True)
のように指定できます。
日本語テキストから変換された音声は、逆にゆっくりしていて、これを早くする指定は gTTS にはありません。
そこで、メディアプレーヤー側で話す速度を変更しています。
mplayer のオプション設定
-speed xx 再生速度の倍率を指定します 0.01?100
-af scaletempo 音の高低を変えずに再生速度のみを変える

$ python3 gTTS_ja.py

ここで、英語で読み上げた後に、英語テキストを日本語に自動翻訳させて、日本語読み上げをさせることを考えてみます。
翻訳用のpythonパッケージをインストールします。

■py-translator
$ sudo pip3 install py_translator
...
Successfully installed Unidecode-1.1.1 beautifulsoup4-4.6.3 idna-2.8 langdetect-1.0.7 lxml-4.2.5 py-translator-2.1.9 python-slugify-1.2.6 requests-2.21.0 urllib3-1.24.3

$ pip3 show py_translator
Name: py-translator
Version: 2.1.9
....

$ python3
>>> from py_translator import Translator
>>> s = Translator().translate(text='Hello World', dest='ja').text
>>> print(s)
こんにちは世界

では、さらに先ほどの外務省の英語ツイートを翻訳してみます。
>>> english='Japan\'s Health Ministry updated its Q&A page. You can find answers to such questions as how you can avoid catching/spreading the virus, what is the "cough etiquette". '
>>> s = Translator().translate(text=english, dest='ja').text
>>> print(s)
日本の保健省はそのQ&Aページを更新しました。あなたは/キャッチウイルスを拡散を避けることができる方法などの質問に対する答えを見つ けることができ、「咳エチケット」ものです。
>>> ctrl+[D]

現段階での、実装は難しいかもしれません。

ここからは、音声合成をもうちょっと深堀りしたい方向けです。

■日本語音声読み上げ Open JTalk
Open JTalkは、名古屋工業大学を中心に開発されたオープンソースのソフトウェアです。
フリーソフトですが商用利用もできます。

パッケージの検索
$ apt-cache search open-jtalk
open-jtalk - Japanese text-to-speech system
open-jtalk-mecab-naist-jdic - NAIST Japanese Dictionary for Open JTalk

インストール
$ sudo apt-get install open-jtalk open-jtalk-mecab-naist-jdic

男性ボイス: nitech_jp_atr503_m001.htsvoice
$ sudo apt-get install hts-voice-nitech-jp-atr503-m001
$ sudo find / -name nitech_jp_atr503_m001.htsvoice -print
/usr/share/hts-voice/nitech-jp-atr503-m001/nitech_jp_atr503_m001.htsvoice

女性ボイス: mei_normal.htsvoice
MMDAgentという別プロジェクトから、メイちゃん音響モデル(Voiceデータ)を流用します。
$ wget https://sourceforge.net/projects/mmdagent/files/MMDAgent_Example/MMDAgent_Example-1.8/MMDAgent_Example-1.8.zip
$ unzip MMDAgent_Example-1.8.zip MMDAgent_Example-1.8/Voice/*
Archive:  MMDAgent_Example-1.8.zip
   creating: MMDAgent_Example-1.8/Voice/
   creating: MMDAgent_Example-1.8/Voice/mei/
  inflating: MMDAgent_Example-1.8/Voice/mei/COPYRIGHT.txt
  inflating: MMDAgent_Example-1.8/Voice/mei/mei_angry.htsvoice
  inflating: MMDAgent_Example-1.8/Voice/mei/mei_bashful.htsvoice
  inflating: MMDAgent_Example-1.8/Voice/mei/mei_happy.htsvoice
  inflating: MMDAgent_Example-1.8/Voice/mei/mei_normal.htsvoice
  inflating: MMDAgent_Example-1.8/Voice/mei/mei_sad.htsvoice
$ sudo cp -r MMDAgent_Example-1.8/Voice/mei/ /usr/share/hts-voice
$ ls /usr/share/hts-voice mei nitech-jp-atr503-m001
OpenJtalkのパラメータ
Option Items  Range  Default 
-x  辞書の指定
-m  音声データの指定
-ow  WAVファイルの指定
-ot  ログファイルの指定 
-a  声質  -0.8~0.8 0.55 
-r  話速 0.5~2.0 1.0  
-fm  音程 -24~24  0.0  
-jf  抑揚  1.0  
-jm  波形増幅? 0.0~  1.0  
  合成テキスト 最大200字  

Open JTalk に日本語テキストを渡し、音声ファイルを生成します。

$ echo 日仏首脳電話会談。3月13日,午後6時10分から約30分間,安倍晋三内閣総理大臣は,エマニュエル・マクロン・フランス共和国大統領と日仏首脳電話会談を行いました。 | open_jtalk -x /var/lib/mecab/dic/open-jtalk/naist-jdic -m /usr/share/hts-voice/mei/mei_normal.htsvoice -r 1.0 -ow japanese.wav

再生します。
$ mplayer japanese.wav

声質、話速、音程、抑揚、波形増幅 のパラメータを変更して試してみてください。

■音響モデル(Voiceデータ)のカスタマイズ
OpenJTalk は自分の声を音響モデルにすることも可能です。
詳細は下記のサイトで詳しく説明しているので参考にしてみてください。
HTS-demoによる自作音響モデルの作り方 その1
HTS-demoによる自作音響モデルの作り方 その2


【参考文献】
Raspberry Pi + Speaker pHat で京急の運行情報を喋らせてみる
py-translator を使ってみる
HMM-based Text-to-Speech System Open JTalk Demonstration Page
OpenJTalk + python で日本語テキストを発話
HTS VOICE
萌え声を探せ!Open JTalkのパラメータをいろいろ変化させてみた!
 Raspberry Pi(ラズベリー パイ)は、ARMプロセッサを搭載したシングルボードコンピュータ。イギリスのラズベリーパイ財団によって開発されている。
2020.01.05 第1回 abcjs 楽譜作成・演奏スクリプト
2020.01.09 I2S通信によるハイレゾ音源再生
2020.01.18 MIDI再生:FM音源YMF825+Arduino編
2020.01.24 FM音源YMF825+micro:bit編
2020.02.13 Piano Hat & Rosegarden
2020.03.18 テキスト読み上げ gTTS
2020.05.19 テキスト読み上げ AquesTalk pico LSI
2020.06.22 波形処理 第1回 音の波と三角関数
2020.07.22 波形処理 第2回 平均律と純正律
2020.08.26 波形処理 第3回 黒鍵と白鍵
2020.11.21 深層学習 第1回環境整備
2020.12.19 深層学習 第2回マルコフ連鎖・自動歌詞生成
2021.01.02 深層学習 第3回コード進行解析
2021.01.16 波形処理 第4回 コード演奏
2021.08.07 MIDI制御/Adafruit Music Maker
2021.08.23 MIDIフォーマット解析
2021.08.24 オーディオアンプ・スピーカー
2021.10.10 音声ファイルの切貼り
2022.09.16 USB-MIDI
2023.01.16 MAX98537 & PCM5102
2023.03.15 音源サンプリング
2023.06.16 ヤマハ音源IC YMZ294
2024.01.07 内蔵DACによるWAV再生
2024.03.23 Piano Hat for MIDI


Arduinoで学ぶ組込みシステム入門(第2版)
●Arduinoを使って組込みシステム開発を理解する
・ハードウェアやソフトウェアなどの基礎知識/ ・設計から実装までを系統的に説明するモデルベース開発/ ・Arduinoを用いた実際の開発例

最新 使える! MATLAB 第3版
◆◆すぐに「使える!」 全ページフルカラー!◆◆
・MATLAB R2022bに対応し、解説もより詳しく!/ ・コマンド・スクリプトの例が豊富で、動かして学べる!/ ・超基本から解説。これから使いはじめる人にぴったり!/ ・全編フルカラー、スクリーンショットも豊富!

Amazon Web Services基礎からのネットワーク&サーバー構築改訂4版
1.システム構築をインフラから始めるには/ 2.ネットワークを構築する/ 3.サーバーを構築する/ 4.Webサーバーソフトをインストールする/ 5.HTTPの動きを確認する/ 6.プライベートサブネットを構築する/ 7.NATを構築する/ 8.DBを用いたブログシステムの構築/ 9.TCP/IPによる通信の仕組みを理解する

C言語は第二の母国語: 独学学生時代から企業内IT職人時代に培った、独立のための技術とノウハウ 平田豊著
学生時代から独学でプログラミングをはじめ、企業内でデバイスドライバを開発し、そして独立後もたくさんのアプリケーション開発や技術書制作に携わってきた著者。その筆者が大事に使い続ける「C言語」の“昔と今”について、気づいたことや役立つ知識、使ってきたツールなどについて、これまで記してきたことを整理してまとめました。 本書では、現役プログラマーだけでなく、これからプログラミングを学ぶ学生などにも有益な情報やノウハウを、筆者の経験を元に紹介しています。

1冊ですべて身につくJavaScript入門講座
・最初の一歩が踏み出せる! 初心者に寄り添うやさしい解説 ・最新の技術が身につく! 今のJavaScriptの書き方・使い方 ・絶対に知っておきたい! アニメーションとイベントの知識 ・プログラミングの基本から実装方法まですべて学べる

図解! Git & GitHubのツボとコツがゼッタイにわかる本
ソフトウェア開発では欠かすことのできないGit、GitHub。 これからGit、GitHubを使いたいという入門者の方でも、実際に手を動かしながら使い方を学べます。

C自作の鉄則!2023 (日経BPパソコンベストムック)
メーカー製のパソコンはスペックが中途半端で、自分が本当に欲しい機種がない――。そう思っている人には、ぜひ自作パソコンをお薦めします。自作パソコンのパーツは進化が速く、しかも驚くほど種類が豊富。価格も性能も、幅広く用意されているため、満足度100%の“自分だけの1台”を手に入れることができます。

Interface 2023年6月号
特集:第1部 フィルタ設計 基礎の基礎/ 第2部 係数アプリや波形観測アプリで合点!FIR&IIRフィルタ作り/ 第3部 配布プリント基板で体験!マイコンで動くフィルタ作り

日経Linux 2023年5月号
【特集 1】 AI時代の最強フリーソフト ~ 25のやりたいを実現! 【特集 2】 AWS、Azureのうまみを無料で体感!面倒なことはクラウドに任せよう 【特集 3】 新しいRaspberry Pi Cameraで遊んでみよう 【特集 4】 Linuxで旧型PCを復活! 1kg切るモバイルPCを「ChromeOS Flex」でChromebook化

ラズパイマガジン2022年秋号
特集:5大人気ボード 電子工作超入門
「半導体不足で在庫が不足し、電子工作のボードがなかなか買えない…」。そんな今にふさわしい特集を企画しました。5種の人気ボードにすべて対応した電子工作の入門特集です。「GPIO」や「I2C」を使った電子パーツの制御方法は、どのボードでも同じです。手に入れられたボードを使って、今こそ電子工作を始めましょう。

地方で稼ぐ! ITエンジニアのすすめ
学歴、理系の知識、専門スキル……全部なくてもITエンジニアになれる! 地方でも高収入でやりがいをもって働ける!ITエンジニアの魅力を一挙大公開

Raspberry Piのはじめ方2022
本書は、ラズパイやPicoの買い方やインストール、初期設定といった基本から、サーバー、電子工作、IoT、AIといったラズパイならではの活用方法まで、1冊でお届けします。 ラズパイをこれから始める方向けに、全36ページの入門マンガ「女子高生とラズベリーパイ」も巻末に掲載。これを読むだけでラズパイがどんなものなのか、すぐに分かって触れるようになります。

ハッカーの学校 IoTハッキングの教科書
生活にとけこみ、家電機器を便利にするIoT技術。 Webカメラなど、便利の裏側に潜むセキュリティの危険性をハッキングで検証。 専門家がパケットキャプチャからハードウェアハッキングまで、その攻撃と防御を徹底解説。 本書は2018年7月に刊行された「ハッカーの学校IoTハッキングの教科書」に一部修正を加えた第2版です。

攻撃手法を学んで防御せよ! 押さえておくべきIoTハッキング
本書は、経済産業省から2021年4月にリリースされた、IoTセキュリティを対象とした『機器のサイバーセキュリティ確保のためのセキュリティ検証の手引き』の『別冊2 機器メーカに向けた脅威分析及びセキュリティ検証の解説書』をもとに、IoT機器の開発者や品質保証の担当者が、攻撃者の視点に立ってセキュリティ検証を実践するための手法を、事例とともに詳細に解説しました。

ポチらせる文章術
販売サイト・ネット広告・メルマガ・ブログ・ホームページ・SNS… 全WEB媒体で効果バツグン! カリスマコピーライターが教える「見てもらう」「買ってもらう」「共感してもらう」すべてに効くネット文章術

プログラマーは世界をどう見ているのか 西村博之著
イーロン・マスク(テスラ)、ジェフ・べゾス(Amazon)、ラリー・ペイジ(Google)…etc. 世界のトップはなぜプログラマーなのか?

ニーア オートマタ PLAY ARTS改 <ヨルハ 二号 B型 DX版> PVC製 塗装済み可動フィギュア
「NieR:Automata」より、ヨルハ二号B型こと2BがPLAY ARTS改に新たに登場! 高級感の感じられるコスチュームや髪の質感、洗練されたボディバランス、細かなデティールに至るまでこだわり抜かれた逸品。 DX版には通常版のラインナップに加え2Bの随行支援ユニット ポッド042などをはじめ“純白の美しい太刀"白の約定やエフェクトパーツ、自爆モードを再現できる換装用ボディパーツ、シーンに合わせて変えられる顔パーツ2種も付属する豪華な仕様に。 作中のあらゆるシーンを再現することが可能なファン必見の一品となっている。

Newtonライト2.0 ベイズ統計
ベイズ統計は,結果から原因を推定する統計学です。AIや医療などの幅広い分野で応用されています。その基礎となるのは18世紀に考えだされた「ベイズの定理」です。 この本では,ベイズ統計学のきほんをやさしく紹介していきます。

白光(HAKKO) ダイヤル式温度制御はんだ吸取器 ハンディタイプ FR301-81


無水エタノールP 500mlx2個パック(掃除)


ケイバ(KEIBA) マイクロニッパー MN-A04


サンハヤト SAD-101 ニューブレッドボード


白光(HAKKO) HEXSOL 巻はんだ 精密プリント基板用 150g FS402-02


[Amazon限定ブランド]【指定第2類医薬品】PHARMA CHOICE 解熱鎮痛薬 解熱鎮痛錠IP 100錠


Copyright © 2011-2024 Sarako Tsukiyono All rights reserved®.