Amazonチャージがお得!1000円もらえるキャンペーン再開>>>

録音したmp3データをGoogle音声入力で一瞬で文字起こしする方法

Googleの音声入力を使って録音データをあっという間に文字起こし(テープ起こし)する方法をお伝えします。

ひでさん

最近の音声入力はここまで来たかという感がある。

音声入力にちょっとしたトラウマがあるぼくでもその進歩に驚かされるほどに。

 

そのトラウマというのは、数年前の音声入力に対するもの。

 

ぼくの車のナビに音声認識機能が付いているんだけど、これがはっきり言って超使えないのだ。

 

口で住所や目的地を言えば認識してくれる機能なんだけど、

たとえばぼくが「東京都渋谷」と言えば

ナビの音声は「岐阜県下呂ですね?」

とか、もう何を聞いているのかと画面に向かってパンチしたくなるレベル。

 

そんなことがあったので、最初は期待していなかったGoogle音声入力だけど、

実際に使ってみて最近の音声認識の精度には驚いた。

 

iPhoneのSiriもそこそこだけど、Googleの日本語認識はもっとすごい。

 

変換の精度もすごくて、ヒトにはちょっと聞き取りづらいよ~って言われるぼくの声もしっかり認識して思い通りの言葉に変換してくれるのだ。

 

しゃべっているだけで、どんどんテキストが完成されていく様子は控えめに言ってもまるで魔法のよう。

まだ使ったことがない方はぜひ、やってみて欲しい。

 

ほんとにびっくりするから。

 

そんなGoogleの音声入力を講義、講演会、会議の議事録などで作成する文字起こし(テープ起こし)に使えるかどうかを試してみた。

 

結論から言うとmp3などの録音したデータをどう認識させるか?に苦労したが、

ちょっとしたテクニックを使うことでかなりのスピードで文字起こしできることが分かった。

 

ということで、以下では録音データをGoogle音声入力を使ってテキスト化する方法を具体的にお伝えしていきたいと思う。

それでは、どうぞ!

この記事のポイント
  • Google音声入力を使った文字起こしの方法
  • 苦手を補ってやるには?
  • 手入力より圧倒的に早い方法

 

▼まずはGoogle音声入力の凄さを再度確認してみよう。

魔法のツール・Google音声入力のスゴさ

Googleドキュメントの音声入力

Googleドキュメントの画面

文字をキーボードで入力するのが、パソコンの常識。

その常識を覆すほどに成長を見せるのがGoogleの音声入力だ。

 

特にPC版は使いやすく、テキスト作成するのに充分戦力になってくれる。

 

そのGoogle音声入力のスゴさを簡単にまとめてみる。

 

大きなところでは次の通り。

  • タイムラグなく即座に文字作成。
  • 前後の文脈にあった漢字変換

実際に使ってみると分かるのだけど、しゃべっている言葉がタイムラグなく画面上の文字として入力されていく様子は圧巻だ。

 

あまりに早口だと難しいけれど、普通に言葉を話すスピードであれば、確実にどんどん文章ができあがっていく。

 

さらに、すごいのは、漢字の変換もわりと適切で入力されていく文章にほとんど修正がいらないこと。

と言っても正確に作成しようとすると、それなりにいるのはいるのだけど、

これくらいならオッケーという許容範囲にばっちり入っている。

 

近い将来キーボードがいらなくなる日も近いかもしれないと本当に思わせてくれる実力を持っているのがGoogle音声入力なのだ。

 

ちなみに、下に紹介しているインタビュー記事は、このGoogle音声入力を使って文字起こしをしてテキストベースを作った。

かなり長いロングインタビューだけど、手打ちで入力していくより早く記事を仕上げることができた実例だ。

サクラスカメラスリング製作者・杉山さくらさんインタビュー!開発秘話や働き方について伺いました。

理想はGoogleの音声入力におまかせで文字起こし完成!だけど…

でも、そんなすごいGoogleの音声入力であっても苦手なものが存在する。

 

それは、機械で録音したものの音声認識は弱いということだ。

 

生声で音声入力する際はPCに標準でついている内蔵マイクであっても認識精度はかなり高いGoogle音声入力だけど、

 

ICレコーダーで録音したデータを再生しする場合には、認識率が一気に下がってしまう。

google音声入力の苦手

▼もう少し具体的に言うと次の点が弱い。

  • ICレコーダーのライン入力録音以外で録音されたあまりクリアでないもの
  • 外部機器で録音したものをPCのマイクに向けて再生して音声認識させるなどの使い方
ひでさん
ライン入力で録音できればベストですが、ICレコーダーをライン入力で録音できる人って、現実的にはイベントや講演会の主催者くらいしかいませんよね。

ぶっちゃけ、機械の声が聞き取れないのはかなりツライ。

だって、機械(ICレコーダー、スマホ)で録音して機械(PCなど)で再生するって、かなりのスタンダードだから。

 

録音データを流しっぱなしで、いつの間にかテキスト完成はまだ難しい

講義や講演会やインタビューをICレコーダーなどで録音した音声をテキストにするには、

音声を繰り返し聞き、キーボードでテキストを打ち込んで文字にするというを何度もやってようやく完成する。

 

これは、時間がかかるしかなり大変な作業だ。

 

この大変な文字起こしの作業を音声入力を使って自動でやってくれればどんなに楽かわからない。

 

たとえば、ICレコーダーとPCをつないで、録音データを再生し音声入力させ、

テレビでも見ている間に勝手にテキストが出来上がっているというようなことができればもう最高。

 

それができたら!と夢見ているのだけれど、まだもうちょっと対応しきれていない様子。

 

どうにかできないかと、

PCで仮想オーディオデバイスとして再生して認識させようとしたり、

ICレコーダーをPCのマイクに向けて再生し、認識させようとしたり、

iPhoneをマイクにしたりと色々と試したが、

どれもgoogle音声入力に認識されない頻度が高く、

実質放置でいつの間にか仕上がっているというのはほぼ不可能だとわかった。

ひでさん
Webミーティングなどをソフト上で録画録音して、再生する方法だとある程度音声認識できるけど、ほとんどの場合途中で録音が止まってしまいます。

ぼくもよくICレコーダーを利用するので、機械の音声も対応してくれたらなと切に願う。

MEMO

実は「完全放置で自動テキスト化」に近い方法があります。

録音した音声データを仮想オーディオデバイスで音声認識させる方法が一番自動テキスト化に近いです。

ただ録音が途中で止まったり、音声がモニター出来なかったり、テキストの修正作業が必要だったりはします。

それでも、少しコツをつかめば上手に運用できるのでは?と思います。

こちらの方法も需要があると思うので、近々記事を書いてみたいと思います。    ←書きました!下記のリンクから。

音声データを自動文字起こしする方法とは?【Windows】VB-Audio Virtual Cable

音声データを自動文字起こしする方法とは?【Windows】VB-Audio Virtual Cable

mp3などの音声データから文字起こしするおすすめの方法

それでも、確実に音声入力の精度が上がっているので、

機械の音声に対応しきれていないからと言って捨て置くのはもったいない。

 

だって、最終目的は正確に音声入力させることじゃなくて、

いかに楽にすばやく音声データをテキスト化することでしょ?

 

その目的を思い出し、今回、あるインタビューで文字起こしした際に、

試行錯誤の結果、次の方法に行き着いたので、ぜひみなさんに紹介したいと思う。

 

その方法とは次のようなものだ。

  1. 音声データを再生して聞く
  2. 聞きながら真似をして、自分で声に出す
  3. 自分の声で音声入力する

と、こんな感じ。

 

この方法は機械の音声の間に自分の声を入れるのがポイントだ。

いわば、自分が機械とGoogle音声入力の仲介役になることで、Google音声入力の苦手をおぎなってやろうという作戦だ。

 

はっきり言って、なんてアナログな方法だと思うかもしれない。

 

でも録音データを再生して聞いて、自分で真似して声を出し、音声入力していくというこの方法は

「完全放置で自動テキスト化」よりは面倒だけど、考えてみれば手入力より圧倒的に早いのだ。

ひでさん
ちなみにぼくはブラインドタッチも普通にできるレベルですが、音声入力はそれよりずば抜けて早いです。

 

しゃべったそばから文字に変換され、特に変換ボタンを押して単語を選ぶ手間がほぼいらないのも書き起こしスピードの速さにつながっていると思う。

(専門用語が多いと変わってくるかもしれませんが)

 

▼次からは具体的な設定方法などをご紹介しよう。

録音データをGoogle音声入力で文字起こしする際に必要なもの

用意するものは次の通り。

  • 録音する機械(ICレコーダーなど)
  • PC
  • 再生ソフト
  • Googleドキュメント(音声入力)
  • ヘッドセット

録音する機械(ICレコーダーなど)

文字起こしするための録音データを用意しよう。

クリアに録音したほうが聞き取りやすくなり後々の作業が楽になるので、スマホのアプリより専用のICレコーダーを使うことをおすすめする。

▼おすすめのICレコーダー

PC

基本的にはPC上で操作するのが一番。

なので、PCを用意しよう。

再生ソフト

ぼくは録音した音声をPCで再生するものとして、ICレコーダーに付属のソフトを使っている。

ICレコーダーを持っている人は付属のソフトがたいていの場合文字起こしにあった機能があるはずだ。

もし、ソフトを持っていないという人は「文字起こしソフト」などのワードで調べると出てくると思う。

 

ポイントとしては、再生の速度を遅くしても音質が変わらない機能があるソフトがいい。(例:SONYのDPCなど)

その理由は録音したデータを聞きながら自分でしゃべるので、再生スピードの調整ができるものが使いやすくなるからだ。

 

また、ショートカットキーで早戻し、早送り、停止などができるものもがあるとさらに便利だ。

細かな点としては、画面を切り替えることなく、ショートカットキーが常時有効になるものだと実用性が高い。

Googleドキュメント(音声入力)

当たり前だけど、GoogleにログインしてGoogleドキュメントの音声入力を用意しよう!

Google Chromeでの操作説明はGoogleにログインした状態で右上のアプリマークをクリック。

続いて表示されたアプリをしたにスクロールする。

ドキュメントという項目があるので、クリックしよう。

Googleドキュメントのページに移動したら、新しいドキュメントを作成するために空白をクリック。

新しいドキュメントが作成されるので、上部にあるツールをクリック。

この中に音声入力という項目があるので、クリック。

小さなマイクの形のアイコンが表示されるので、これで準備OK.

クリックすれば赤くなって録音スタンバイ状態になる。

ただし、少しでも他の項目を触ると録音停止になるのですべての準備が整ってから録音スタンバイにするようにしよう。

ヘッドセットマイク

PCから内部スピーカーで音を出すと、自分の声と機械の音声が混ざってしまい音声の認識が甘くなってしまう。

なので、録音データはイヤホンで聞くようにするのがgood。

また、マイクもあると認識させやすくなるので、それらの条件を満たしてくれるヘッドセットマイクがおすすめだ。

録音データをGoogle音声入力で文字起こしする際の手順

一応ぼくが実践している具体的な方法をお伝えする。

手順は以下の通り。

  1. まず、PCのクロームやEdgeなどのWEBブラウザでGoogleにログインし、Googleドキュメントを開く。
  2. 音声入力のポップアップを出して、スタンバイ状態にさせておく。
  3. 再生ソフトを立ち上げる。
  4. 録音データを再生して、自分の耳で聞く。
  5. Google音声入力を認識させるスタートボタンを押す。
  6. 録音データを真似して、自分でしゃべって音声入力していく。

以上の手順に沿えばすばやく録音データをテキスト化できる。

 

ポイントとしては、録音データを再生する際には再生速度を遅くするのがおすすめ。

再生速度を遅くすると録音データを聞き取りながらでもスムーズに真似してしゃべれるので、

結果的に巻き戻しを使う頻度が少なくなるからだ。

 

また、もし聞き取れなかったという場合はマウスやトラックパッドでカーソルを操作するよりも、

ショートカットキーで巻き戻す方がダンゼン早い。

 

ショートカットキーはソフトや設定で変わってくるので、事前に確かめてから音声入力に入ったほうがいい。

(この時、ショートカットキーがブラウザを見ている状態でも操作できるソフトであれば、Google音声入力が止まらないので便利。)

 

…とこんな感じ。

▼さらに、後から文字を一括で変更できるGoogleドキュメントのツールも合わせれば、正確に素早く文字起こしすることができます。

【ビジネス時短スキル】Googleドキュメントで文字を一括変更する方法

録音データを真似してしゃべって、文字起こしするメリット

もしかすると、タイピングがめちゃくちゃ得意な人からすると手打ちしたほうが早いと感じるかもしれない。

そうであっても大きなメリットとして挙げられるのが、「疲れない」ということ。

 

音声入力の場合、手をほとんど使わないし、目をつぶっていてもテキスト入力ができる。(これってものすごいこと!)

 

そのため圧倒的に文字起こしの際の手や目の疲労感が違ってくる。

もし、手や目の疲労感で悩まれている方はぜひ、こちらの方法を試してみることをおすすめする。

録音データをGoogle音声入力ですばやく文字起こしする方法 まとめ

今回は録音データをGoogle音声入力ですばやくテキスト化する方法をお伝えした。

残念ながら、録音データを再生しっぱなしでいつの間にかテキストが出来上がっているというのは現時点ではできないが、

録音データと自分の声とGoogle音声入力をあわせることで、圧倒的に手入力より早くテキスト化する方法があることがわかった。

ぜひ、文字起こしで苦労されている方はこちらの方法を使ってみて欲しいと思う。

ほんと、はかどるから!!

 

それでは、また!

ひでさんでした!(@tekutekuhidesan

▼おすすめのICレコーダー

合わせて読みたい

音声データを自動文字起こしする方法とは?【Windows】VB-Audio Virtual Cable ログイン不要ですぐ使える!音声入力Speechnotesの使い方(PC) サクラスカメラスリング製作者・杉山さくらさんインタビュー!開発秘話や働き方について伺いました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA


このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください