ワタクシゴト

声を取り戻す話(1)

声を取り戻す話(1)

今回は声を取り戻す話です。
具体的にはCoeFontやCoeiroInkを試してみました。

この動画は「声まで失って落ちぶれた」私が
声を取り戻す話です。もともとAquesTalkでいったん取り戻したのですが、
最終的な目的のために色々画策しており、その一端を紹介、という回です。

結論

CoeFont高いよ……CoeiroInkにするよ……

私の用途から考えると、CoeFontはまだコストが高くて置き換えは今はちょっと
難しいです。今のところの計画だとほとんどは声がひとつあれば良いから、
CoeiroInkを使いたいです。それで、使えるようにするために今の仕組みを
切り替えていかないとなぁ、と思っているワケです。

というか、そもそもの話。
なんで音声使っていないの?という話になると思います。

そもそもなんで?

ここまでちょっとだけ話したことがあるのですが、
私の過去の動画作成手順がこんな感じでした。

  1. 作成する内容を思いつく
  2. パワーポイントに思いつく限り書きなぐる
  3. 情熱の赴くままにピーチクパーチク喋り倒す
  4. 動画編集という名目で反省しつつカットする
  5. 再生テストしながら、さらに反省する
  6. 納得できたら投稿

……どう考えても、思いつく限り書きなぐる、という工程が問題ですね。
これのお陰で、後半の作業が反省とか後悔とかしながら作業を進めることになるので、
それだったらと思い、考えなおしました。

  1. (改)書く内容を事前に考えて台本を作成しておく

こうすることで、反省とか後悔とかは大幅に抑えられるのですが、時間がかかります。
その上、カット編集する手間は変わらないということから、再生テストは発生します。
さらに考え直しました。

  1. (改)台本から音声出力する。

これで、動画編集と再生テストが無くなる。やったね!
……と思ったのですが、現実は再生テストは今も続いています。
再生してみると、思ったように喋ってくれないので手直しが必要です。
そうやって今は作成しているのです

気になっている点としては、いわゆるゆっくり音声の質というか汎用性。
みんなが使っているということもあって、YouTubeの歴史の中では
まとめて収益停止になる、という憂き目にもあっていることもあり、
できれば、別の音声を使いたいなぁ、
できれば、最終的に自分の声を取り戻したいなぁ、
などと妄想していたのです。
なので、別音声を模索/調査しました。

模索でたどり着いたCoeFont/CoeiroInk

希望しているのは、

  • 安価で対応できること
  • 音声ファイル作成が容易であること
  • できるだけ独自の声が使えること

の3点。

今のところ収益化が先の山であることを考えると、まずは費用が
できるだけ無い側に近いモノを選びたいです。 AquesTalkを使っている
理由もそのあたりにあるのですが(AquesTalkはライセンス必要です。要注意!)
初期費用も運用コストもできるだけ無料に近い方が少なくとも今は
優先度の高い項目です。

次に音声ファイル作成が容易であることです。
AquesTalkを多用していることはコストもさることながら、コマンドラインから
テキストを流し込んで音声ファイルを作成できることが強みなのです。
他のアプリでもできるのかもしれないけど、ハッキリ名言されているので、
パワーポイントからの作成が非常に容易でした。

まあ、動画として動きのあるものを作るのであれば、
ゆっくりムービーメーカーを使うのが王道のような気がしていますが、
幸いにして(?)あまり動きのある動画を作っていないので、
今のところはこれで十分だと思っています。
とは言っても、こちらも最終的に時間が許すなら動画作成ツールでも
良いのかもしれない、とも思っています。

3つ目は動画で使う音声ができるだけ独自の声で使えるようになることです。
音声は独自にしたいというか、最終的に声を取り戻す、という話をしているので、
理想としては自分の声を使った音声合成ができれば良いと思っています。
そのためには独自性の高い音声合成システムを用意しないと、というのが
理想に近づく道だと考えました。

この3点を満たしそうなものを調査した結果がこちら。

  • CoeFont
  • CoeiroInk
  • VoiceVox

調べてみるとこんな感じでした。期待値込みです。
期待値込みなのは黒塗りつぶしのアイコンで表示です。

費用 ファイル作成 独自音声
CoeFont
CoeiroInk
VoiceVox

VoiceVoxは良さそうだけど、音声モデルが基本女性のみなので今後に期待です。
CoeiroInkは現状で音声モデルに男性の音声あり、将来的に独自音声に対応する
可能性があるため期待値込みの○としています。
独自音声を現時点で最速で実装しようと思うと、CoeFont一択ですね。
無料では使えないのですが、独自性の高さは断トツなのでまずCoeFontを
試してみようと思いました。

試用してみる、かつ試行してみる

CoeFontさんを試してみよう、そのためにも課金して作成してみようと思ったのですが、
ちょうどその時期にCoeFont Fes2022というものをやっていたので思い切って
各感情でのデータ作成をやってみました。ええ、無料でした。ありがたい。

早速使ってみようと思ったのですが、プラン選択で1つ問題が発生しました。
ライトプランが概ね10,000文字で500円……。
前の動画でも挙げたことがあるのですが、私の動画の文字数はだいたい5,000文字になります。
しかも、再生テストを行った上でリテイクすることを考えると、ほぼ1回の動画で
500円を消費してしまうということになります。これは身の丈に合わない。
仕方がないので、ワンポイントで使うか出世したら使うか……のように考えています。

このままでは「使えませんでした。終わり」みたいな結末になってしまうので、
次点の解であった、CoeiroInkを活用してみようと思います。
CoeiroInkであれば、おふとんPさんの音声が男性のものなのでこれを活用させてもらうことで
目的を達成できそうです。その場合必要なのは、
コマンドラインでの実行が可能かどうかにかかっています。

AquesTalkの利点はコマンドラインで利用できる、ということですので、すごく重要です。
結論から言うと、なんとかなりそうなので近いうちにAquesTalkから乗り換える予定です。
実現可能ということが分かった、というだけなので実装しないといけないのが
実は課題なのですが、早めに対処したいところです。
ただ、今なぜか時間がとりにくいのが難点なんですよね。早いところなんとかしないと。

まとめ

今のところの展開としては、

  • とりあえず試すならAquesTalkを継続
  • 近いうちにCoeiroInkに移行して様子見する
  • お金に余裕ができたらCoeFontに活用したい

という三段活用にしようと思っています。

今回扱わなかったVoiceVoxさんも、積極的に使っていって良いと思います。
なんと言っても、コマンドラインで実行可能なのはVoiceVoxさんも同じ、というか
VoiceVoxさんとCoeiroInkさんが共通のUIなので、ちょっと設定をいじるだけで
同じように利用することができるのです。
だから、VoiceVoxとCoeiroInkの音声を両方使うようなアプリも作れるな、とか思ってます。

ここまで話を進めたところに新しい勢力が参入してきています。
voicepeak、初回優待ダウンロード版は15,800円で6ナレーターが使い放題。
これは大きな転換点になる年になりそうな予感がすごくしています。
とりあえず、早いうちに利用できるようにしたいと思ってます。
自分の声を取り戻すとは別の話ですけど、夢が広がります。
来年の今頃にはYouTube界の機械音声のレパートリーも色々変わりそうですね。

また、別解としてCoeFontがCoeiroInkさんと提携、という動画もあるので、
ここが何か動きがあれば面白いことになるかも……と思ったりしています。
注視していきたいところですね。動きがあればまた紹介していく予定です。

とりあえず3月中に声を変更しようと決意したことを宣言として
この回を終わろうと思います。

こぼれ話

自分でも音声合成やってみたいとは思っているんですよ。ビデオカードも購入済みですし。
でも、自分の音声を合成するためだけに色々勉強するのが果たして効果的か、と言われると、
費用対効果に見合うか、という問題が常に出てくるんですよね。
とは言え、いずれはその領域にも足を踏み入れたいと思っていて、
とりあえずUdemyの講座をサクッと購入したりもしています。
この辺のお話も、また別の機会にお話しできればと思います。

今のところの次回予告としては、実は2月の停滞の半分を占めていた、
原稿書き環境をどうするか問題がようやく落ち着きそうなので、その点について
早いうちに情報をまとめて更新したいと思っています。
自分の作業環境の説明兼、使用環境の宣伝になる予定です。
当然ながら、宣伝するに当たり1円も貰ってません。
ある程度使えそうなことが自分の中でまとまった、というのが大きいです。

-ワタクシゴト
-

© 2022 くつぺ