フリーソフトを探して、やっと使えるようになった音声読み上げソフト…実際に使ってみて、あまりの読み違えの多さに愕然としていませんか?
今回は、実際に文書校正で利用しているフリーソフト『Balabolka』について、使い勝手がよくなるように、読み間違え解消チューンナップをします。
チューンナップといっても、実際には読み間違えを減らすように、辞書登録を簡単に一気に行う方法についてまとめています。
『Balabolka』について
Balabolkaはテキストファイルの音読をするプログラムです。
人の音声を再生するために、コンピューターに設定されているどのスピーチシンセサイザーでも使うことができます。
Balabolkaは、クリップボードのコンテンツを音読したり、AZW、AZW3、CHM、DjVu、DOC、EPUB、FB2、HTML、LIT、MOBI、ODT、PDB、PDF、PRC、RTF、TCR、WPDのファイル形式にあるテキストを表示したり、字体や色の設定を変えたり、グローバルショートカットキーを使って音読のプロセスを管理したり、キーボードで入力したテキストの発音や正書法の確認をしたり、テキストファイルをサイズの小さいものにして分けたり、同形異義語を探したりできます。
Balabolka ダウンロードはこちらから
『Balabolka』の設定
まず上の「Balabolka」のリンクからダウンロードします。
今回は、インストールしないタイプ(Portableバージョン)を使って説明します。
ページを下に下げると以下のようなダウンロード案内がありますので、ここからダウンロードします。
ダウンロード後は、解凍すると『Balabolka』フォルダーができ、開くと以下のようになります。
そして、「balabolka.exe」をクリックして、起動します。
音声合成エンジン「Microsoft Haruka Desktop」を利用
Windows 8以上なら、すでに搭載されているはずですので、読み上げソフトで「Microsoft Haruka Desktop」を設定してください。
フリーで使える音声合成エンジンのなかで、通常は一番問題が少ないと思われます。
もともとテストしたパソコンはWindows 10で、音声合成エンジンを使える設定になっていますので、すぐに使えました。
『Balabolka』の辞書登録方法
まず、自分の辞書を作りましょう。
下のGIFアニメに辞書の作り方がわかるようになっています。
最初は、「_default.dic」を開いて辞書がどうなっているのかを見てみましょう。
次にオリジナルの自分の辞書を、新規で作成しています。
名前は、自由につけてもらっても大丈夫です。
次のGIFアニメは作った自分の辞書に、実際に一つずつ登録しているところです。
- 辞書を選びます
- 次に編集をクリックします
- 「次の発音」の部分に読めない単語を入れます
- 上の「分析」ボタンですでに同じ登録が無いかを調べます
- 何も無いので、そのまま閉じます
- 次に「このように」の部分に正しい読み方を記載します
- 追加ボタンを押します
- そして最後に保存ボタンを押します
これで一語だけですが、単語登録ができました。
さあチューンナップ
これじゃいくら時間があっても、単語登録に途方も無い時間が必要だ…と思われることでしょう。
さすがに、そんな無駄はできませんので、時間の節約をします。
人の手を借りる
すでに誰かが作って、公開している辞書が無いかを確認します。
ここでのポイントは、完全に使えるものである必要はありません。
また、どんな形や、場合によっては違う辞書でもかまいません。
先ほど辞書の構成を確認していますので、その形に仕上げればどうにでもなります。
『Balabolka』にあうように加工しよう
つまり、以下のような法則で仕上げます。
読ませたい単語=読みかた
この形でいくつも用意します。
鮎魚女=アイナメ
鮎並=アイナメ
生憎=アイニク
媾曳=アイビキ
梧桐=アオギリ
・
・
・
つまり、適当な辞書がみつからなければ、あなたが必要と思う「当て字」「業界用語」「難読文字」などの一覧から作ってもよいでしょう。
辞書への登録は下のGIFアニメをご覧ください。
これで終わりです。
ちなみにちゃんと読めているか確認してみましょう。
辞書のチェックをはずしたり、チェックしたりして確認します。
辞書登録してもきちんと読めない場合
辞書登録しても読めない時があります。
それは、『Balabolka』自体が単語の範囲のとらえ方が違うので、登録したものと異なると解釈してしまっている場合です。
たとえば
「鮎魚女」
単体の単語ならば、「アイナメ」と読めますが
「鮎魚女ってどう読むのかな」
とした場合は、まともに読めないことでしょう。
その場合は、辞書を開いて
鮎魚女=アイナメ
となっているのを
鮎魚女*=アイナメ
と「*」を入れてあげます。
つまり
鮎魚女○○
となっていても
アイナメ〇〇
と読むように教えてあげていますので、これで読めるようになります。
まとめ
フリーソフト『Balabolka』について、使い勝手がよくなるように、読み間違え解消チューンナップをします。
チューンナップといっても、実際には読み間違えを減らすように、辞書登録を簡単に一気に行う方法についてまとめています。
Balabolkaはテキストファイルの音読をするプログラムです。
人の音声を再生するために、コンピューターに設定されているどのスピーチシンセサイザーでも使うことができます。
『Balabolka』の辞書登録方法
まず、自分の辞書を作ります
- 辞書を選び
- 次に編集をクリック
- 「次の発音」の部分に読めない単語を入れ
- 上の「分析」ボタンですでに同じ登録が無いかを調べ
- 何も無ければ、そのまま閉じ
- 次に「このように」の部分に正しい読み方を記載
- 追加ボタンを押し
- 最後に保存ボタンを押す
これで単語登録ができました。
チューンナップ
すでに誰かが作って公開している辞書が無いかを確認し、場合によっては違う辞書でもかまいません。
読ませたい単語=よみかた
この形でいくつも用意します。
鮎魚女=アイナメ
鮎並=アイナメ
生憎=アイニク
媾曳=アイビキ
梧桐=アオギリ
・
・
・
そして、一括登録すれば、一気に読めるようになります。
ただ、登録しても、うまく読めない字については
例
鮎魚女=アイナメ
となっているのを
鮎魚女*=アイナメ
と「*」を入れてあげます。
これで、読めるようになります。
コメント
バラボルカを使って音声データをテキストから作っているのですが、体をテイと言ったり、読み間違えが多いです。
良い辞書があれば教えてください。
こちらでも辞書を公開されているようなコメントもありますが、
どこにありますか?
また、辞書を上書きする時は前のデータはどうなるのでしょうか?
www!をワールドワイドウェブ
体をたい
と読んで困ります。
○○○○○も○の数が一つと認識してしまいます。
自分の辞書に登録しても、やっぱり、五文字の〇と認識しません。
こちらを見せてもたって、アスタリスクボタンを探してみましたがありません。
UIが変わったのでしょうか?
お忙しいところ恐縮ですが、教えていただければ幸いです。
ご質問についてですが、このBalabolkaの記事は、2017年7月1日に記載しています(記事タイトルの下の日付)ので、その当時のバージョンになりますので、質問されているBalabolkaのバーションを比べてください。
また、記事のページにあるスクリーンショットで、バージョンが確認できると想います。
なお、こちらの事情になりますが、このブログにも書いておりますように、記事を書いた次の月にパソコンのHDDがクラッシュして、メインの環境をWindowsからLinuxに変えてしまっていますので、それ以降Balabolkaは使っておりません。
そのため、細かく説明ができませんので、ご了承ねがいます。
そう言いましても、ご質問されるにもだいぶ時間がかかったことと思いますので、一般論といいますか、体験談になりますが、少し書かせていただきます。
どのような目的で読み上げさせるのかわかりませんので、なんとも言えませんが、読み上げデモのように、書いてある文章を正確に読ませたいという希望ならば、有料のもので対応するほうが良いでしょう。
もし、無料ソフトでやるならば、文章の区切りも考える必要があります。
一般的に日本語の形態素解析エンジンを使う場合は、形態素解析(分かち書き)を行う歳に、辞書の情報を含めて解析することができるようにつくられているのか、それともそうなっていないのかで違ってきますので、ソフト製作者の設計によって、形態素解析後にユーザー辞書という形だと難しいでしょう。
例えばですが、「○○する方」(かた)、「方」を「ほう」ではなく「かた」とう読ませたくても必ず「ほう」と読むソフトがあります。
この場合、「する方」「される方」「したい方」「したくない方」…延々に登録しても、辞書登録以前の仕組みで区分けされて「する」と「方」のようにわけられてしまうと、長時間かけて、辞書登録しても無意味になってしまいます。
じゃあどうするのかということですが、文章を変えたほうが早いです。
辞書を参照する前の段階で、はねられてしまっては辞書登録で対処できません。
今の例の場合は、「する方」「される方」「したい方」「したくない方」と、このようにはしないで、「する人」「される人」「したい人」「したくない人」と考えて、「方」という表現方法を使わないで文章を書くようにすることで、対処します。
また、YouTubeの動画のナレーションなどにするつもりなら、読まない単語は「カタカナ」や「ひらがな」で書くことで、読ませるという方法もあります(つまり、読み上げ用の原稿は別に用意する)。
以上になりますが、求める答えにはならないでしょうが、ご返事にかえさせていただきます。