30代兼業パパブロガーのプロフィールを見る

録音したmp3データをGoogle音声入力で一瞬で文字起こしする方法

Googleの音声入力を使って録音データをあっという間に文字起こし(テープ起こし)する方法をお伝えします。

ひでさん

最近の音声入力はここまで来たかという感がある。

音声入力にちょっとしたトラウマがあるぼくでもその進歩に驚かされる。

 

そのトラウマっていうのは、数年前の音声入力に対するもの。

ぼくの車のナビに音声認識機能が付いているんだけど、これがはっきり言って超使えないのだ。

 

口で住所や目的地を言えば認識してくれる機能なんだけど、

たとえばぼくが「東京都渋谷」と言えば

ナビの音声は「岐阜県下呂ですね?」

とか、もう何を聞いているのかと画面に向かってパンチしたくなるレベル。

 

そんなことがあったので、最初は期待していなかったGoogle音声入力だけど、

実際に使ってみて最近の音声認識の精度には驚いた。

 

iPhoneのSiriもそこそこだけど、Googleの日本語認識はかなりすごい。

変換の精度もすごくて、ヒトにはちょっと聞き取りづらいよ~って言われるぼくの声もしっかり認識して思い通りの言葉に変換してくれるのだ。

 

しゃべっているだけで、どんどんテキストが完成されていく様子は控えめに言ってもまるで魔法のよう。

まだ使ったことがない方はぜひ、やってみて欲しい。

 

ほんとにびっくりするから。

 

そんなGoogleの音声入力を講義、講演会、会議の議事録などで作成する場面がある、

文字起こし(テープ起こし)に使えるかどうかを試してみた。

 

特にmp3などの録音したデータをどう認識させるか?に苦労したが、

結果、多少クセがあるGoogle音声入力だけど、

ちょっとしたテクニックを使うことでかなりのスピードで文字起こしできることが分かった。

 

ということで、以下では録音データをGoogle音声入力を使ってテキスト化する方法を具体的にお伝えしていきたいと思う。

それでは、どうぞ!

この記事のポイント
  • Google音声入力を使った文字起こしの方法
  • 苦手を補ってやるには?
  • 手入力は圧倒的に早い方法

魔法のツール・Google音声入力のスゴさ

Googleドキュメントの音声入力

Googleドキュメントの画面

文字をキーボードで入力するのが、パソコンの常識。

その常識を覆すほどに成長を見せるのがGoogleの音声入力だ。

特にPC版は使いやすく、テキスト作成するのに充分戦力になってくれる。

 

そのGoogle音声入力のスゴさを簡単にまとめてみる。

大きなところでは次の通り。

  • タイムラグなく即座に文字作成。
  • 前後の文脈にあった漢字変換

実際に使ってみると分かるのだけど、しゃべっている言葉がタイムラグなく画面上の文字として入力されていく様子は圧巻だ。

あまりに早口だと難しいけれど、普通に言葉を話すスピードであれば、確実にどんどん文章ができあがっていく。

 

さらに、すごいのは、漢字の変換もわりと適切で入力されていく文章にほとんど修正がいらないこと。

と言っても正確に作成しようとすると、それなりにいるのはいるのだけど、

これくらいならオッケーという許容範囲にばっちり入っている。

 

近い将来キーボードがいらなくなる日も近いかもしれないと本当に思わせてくれる実力を持っているのがGoogle音声入力なのだ。

理想はGoogleの音声入力におまかせで文字起こし完成!だけど…

でも、そんなすごいGoogleの音声入力であっても苦手なものが存在する。

それは、機械で録音したものの音声認識は弱いということだ。

 

生声で音声入力する際はPCに標準でついている内蔵マイクであっても認識精度はかなり高い。

でも、ICレコーダーで録音したデータを再生しする場合には、認識率が一気に下がってしまう。

google音声入力の苦手

▼もう少し具体的に言うと次の点が弱い。

  • ICレコーダーのライン入力録音以外で録音されたあまりクリアでないもの
  • 外部機器で録音したものをPCのマイクに向けて再生して音声認識させるなどの使い方
ひでさん
ライン入力で録音できればベストですが、ICレコーダーをライン入力で録音できる人って、現実的にはイベントや講演会の主催者くらいしかいませんよね。

ぶっちゃけ、機械の声が聞き取れないのはかなりツライ。

だって、機械で録音して機械で再生するって、かなりのスタンダードだから。

 

講義や講演会、インタビューをICレコーダーなどで録音して、これをただ単に聞き直す分にはいいのだけど、

テキスト化しようと思って、「文字起こし」をしようとすると、いっきに大変になる。

 

音声を聞いて、キーボードで打ち込んで、文字にしてという作業。

これを繰り返し繰り返しやってようやくテキストが完成する。

これは、時間がかかるしかなり大変な作業だ。

 

この大変な文字起こしの作業を音声入力を使って自動でやってくれればどんなに楽かわからない。

たとえば、ICレコーダーとPCをつないで、録音データを再生し音声入力させ、

テレビでも見ている間に勝手にテキストが出来上がっているというようなことができればもう最高。

それができたら!と夢見ているのだけれど、まだもうちょっと対応しきれていない様子。

 

どうにかできないかと、

PCで仮想オーディオデバイスとして再生して認識させようとしたり、

ICレコーダーをPCのマイクに向けて再生し、認識させようとしたり、

iPhoneをマイクにしたりと色々と試したが、

どれもgoogle音声入力に認識されない頻度が高く、

実質放置でいつの間にか仕上がっているというのはほぼ不可能だとわかった。

ひでさん
Webミーティングなどをソフト上で録画録音して、再生する方法だとある程度音声認識できるけど、ほとんどの場合途中で録音が止まってしまいます。

ぼくもよくICレコーダーを利用するので、機械の音声も対応してくれたらなと切に願う。

mp3などの音声データから文字起こしするおすすめの方法

それでも、確実に音声入力の精度が上がっているので、

機械の音声に対応しきれていないからと言って捨て置くのはもったいない。

 

だって、最終目的は正確に音声入力させることじゃなくて、

いかに楽にすばやく音声データをテキスト化することでしょ?

 

その目的を思い出し、今回、あるインタビューで文字起こしした際に、

試行錯誤の結果、次の方法に行き着いたので、ぜひみなさんに紹介したいと思う。

 

その方法とは次のようなものだ。

  1. 音声データを再生して聞く
  2. 聞きながら真似をして、自分で声に出す
  3. 自分の声で音声入力する

と、こんな感じ。

 

この方法は機械の音声の間に自分の声を入れるのがポイントだ。

いわば、自分が機械とGoogle音声入力の仲介役になることで、Google音声入力の苦手をおぎなってやろうという作戦だ。

 

録音データを再生して聞いて、自分で真似して声を出し、音声入力していくというこの方法は

放置で完成よりは面倒だけど、考えてみれば手入力より圧倒的に早い。

ひでさん
ちなみに、ぼくはブラインドタッチも普通にはできるレベルです。

しゃべったそばから文字に変換され、特に変換の手間がほぼいらないのも書き起こしスピードの速さにつながっている。

(専門用語が多いと変わってくるかもしれませんが)

 

次からは具体的な設定方法などをご紹介しよう。

録音データをGoogle音声入力で文字起こしする際に必要なもの

用意するものは次の通り。

  • PC
  • 再生ソフト
  • Googleドキュメント(音声入力)
  • ヘッドセット

PC

基本的にはPC上で操作するのが一番。

なので、PCを用意しよう。

再生ソフト

ぼくは録音した音声をPCで再生するものとして、ICレコーダーに付属のソフトを使っている。

ICレコーダーを持っている人は付属のソフトがたいていの場合文字起こしにあった機能があるはずだ。

もし、ソフトを持っていないという人は「文字起こしソフト」などのワードで調べると出てくると思う。

 

ポイントとしては、再生の速度を遅くしても音質が変わらない機能があるソフトがいい。(例:SONYのDPCなど)

その理由は録音したデータを聞きながら自分でしゃべるので、再生スピードの調整ができるものが使いやすくなるからだ。

 

また、ショートカットキーで早戻し、早送り、停止などができるものもがあるとさらに便利だ。

細かな点としては、画面を切り替えることなく、ショートカットキーが常時有効になるものだと実用性が高い。

Googleドキュメント(音声入力)

当たり前だけど、GoogleにログインしてGoogleドキュメントの音声入力を用意しよう!

ひでさん
ちなみに場所は、Googleドキュメント→ツール→音声入力です。

ヘッドセットマイク

PCから内部スピーカーで音を出すと、自分の声と機械の音声が混ざってしまい音声の認識が甘くなってしまう。

なので、録音データはイヤホンで聞くようにするのがgood。

また、マイクもあると認識させやすくなるので、それらの条件を満たしてくれるヘッドセットマイクがおすすめだ。

 

録音データをGoogle音声入力で文字起こしする際の手順

一応ぼくが実践している具体的な方法をお伝えする。

手順は以下の通り。

  1. まず、PCのクロームやEdgeなどのWEBブラウザでGoogleにログインし、Googleドキュメントを開く。
  2. 音声入力のポップアップを出して、スタンバイ状態にさせておく。
  3. 再生ソフトを立ち上げる。
  4. 録音データを再生して、自分の耳で聞く。
  5. Google音声入力を認識させるスタートボタンを押す。
  6. 録音データを真似して、自分でしゃべって音声入力していく。

以上の手順に沿えばすばやく録音データをテキスト化できる。

ポイントとしては、録音データを再生する際には再生速度を遅くするのがおすすめ。

再生速度を遅くすると録音データを聞き取りながらでもスムーズに真似してしゃべれるので、

結果的に巻き戻しを使う頻度が少なくなるからだ。

 

また、もし聞き取れなかったという場合はマウスやトラックパッドでカーソルを操作するよりも、

ショートカットキーで巻き戻す方がダンゼン早い。

ショートカットキーはソフトや設定で変わってくるので、事前に確かめてから音声入力に入ったほうがいい。

(この時、ショートカットキーがブラウザを見ている状態でも操作できるソフトであれば、Google音声入力が止まらないので便利。)

 

…とこんな感じ。

録音データを真似してしゃべって、文字起こしするメリット

もしかすると、タイピングがめちゃくちゃ得意な人からすると手打ちしたほうが早いと感じるかもしれない。

そうであっても大きなメリットとして挙げられるのが、「疲れない」ということ。

 

音声入力の場合、手をほとんど使わないし、画面を見なくても入力ができる。(これってものすごいこと!)

そのため圧倒的に文字起こしの際の手や目の疲労感が違ってくる。

もし、手や目の疲労感で悩まれている方はぜひ、こちらの方法を試してみることをおすすめする。

録音データをGoogle音声入力ですばやく文字起こしする方法 まとめ

今回は録音データをGoogle音声入力ですばやくテキスト化する方法をお伝えした。

残念ながら、録音データを再生しっぱなしでいつの間にかテキストが出来上がっているというのは現時点ではできないが、

録音データと自分の声とGoogle音声入力をあわせることで、圧倒的に手入力より早くテキスト化する方法があることがわかった。

ぜひ、文字起こしで苦労されている方はこちらの方法を使ってみて欲しいと思う。

ほんと、はかどるから!!

 

それでは、また!

ひでさんでした!(@tekutekuhidesan

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください