株式会社グローバルゲート公式ブログ

音声データを文字データに簡単変換!無料で使える文字起こしアプリ5+1選

こんにちは、株式会社グローバルゲートのモーリーです。 
 本日から4月、新年度ということで進学や就職、転職、引っ越しなど生活環境が大きく変わった方もおられるかもしれません。
新しい環境は不安になることも多いですが、これまでとは違ったチャレンジができる絶好の機会です。
新生活がはじまる方はぜひその環境を楽しんでいただきたいと思います。

なお、本記事の公開日は4月1日ですが記事内容に嘘はありませんので安心してご覧ください。

さて、今回は音声データをテキストに変換する、いわゆる「文字起こし」ができる無料アプリ5選(と有料アプリ1選)をご紹介したいと思います。 
 

文字起こしは会議や講演会の議事録の作成、インタビューの文書化などで古くから行われてきた事務作業です。 
従来は人間が耳で聞きながら文章を入力していましたが、コンピュータの音声認識機能の発達やAIによる補完機能により、音声データを入力すれば文書化することができるアプリが多数登場しています。高機能なアプリになるとリアルタイムに発話を認識し、文書生成が可能なものもあります。 
 
近年ではYoutube動画の字幕用データ作成のニーズが高まっており、それに伴って文字起こしアプリの高機能化が進んでいます。 
また、キーボードによる文字入力の苦手な方が文書入力の代用にするという使い方もされています。 
 

ということで、そんな文字起こしアプリの中から無料(有料プランありも含む)で使用できるアプリを5選ご紹介します。 
実際に音声データを入力してみて、その結果も比較してみました。 

無料で使えるアプリケーション(有料枠ありも含む) 

入力テストには青空文庫を朗読した青空朗読より智恵子抄 - レモン哀歌のmp3ファイルを使用しました。 

Googleドキュメントは文字起こしアプリではなくWordの代替となるドキュメント作成アプリですが、音声入力機能がついており文字起こしに使うことができます。
本来はマイクに向かって喋っている言葉をリアルタイムに文字にする機能となりますので、音声データから文字に起こす場合はひと工夫必要です。 

使用方法

音声ファイルを使用する場合、パソコンで再生されている音声を入力として使用する設定にする必要があります。 
マイクに向かって喋る代わりにパソコンで再生している音声を使用する、というイメージです。 

1.「サウンドデバイスを管理する」で入力デバイスを「ステレオミキサー」に設定します。 
無効となっている場合は「有効」にしてください。 

2.出力デバイスがない場合(スピーカーなどがつながっていない場合)はイヤホンなどをつないで音声が再生できるようにしてください。 

3.Googleドキュメントのメニューより「ツール」→「音声入力」を選択します。 

4.音声ファイルを再生し、マイクのアイコンをクリックします。 
音声入力中はGoogleドキュメントを開いているウインドウをアクティブにしておかないと入力されません。 

結果

高村光太郎作 智恵子抄 よりレモン哀歌
そんなにもあなたはレモンを待っていた
悲しく 白く 明るいしのとこで 
私の手から取った1つのレモンをあなたのきれいな歯がガリリと噛んだ
トパーズ色の立つその数的の天のものなるレモンの汁はたとあなたの意識を正常にした 
あなたの青く住んだ 目がかすかに笑う 
私の手を握る 穴からの健康作用 
あなたの 喉に嵐はあるが こういう命の瀬戸際に千恵子は元の千恵子 となり 
生涯の愛を一瞬に傾けた 
それから 人時 昔 3点でしたような深呼吸を一つして
期間はそれなり 止まった
写真の前にさした桜の花影に涼しく光るレモンを今日もお香 
昭和14年2月 

漢字変換がおかしなところはありますが、概ねいい結果が得られたのではないかと思います。
ですが音声入力の最中にGoogleドキュメント自体がエラーとなってしまうケースが多く、私の環境が悪いのか音声ファイルからの入力に難があるのか…。
エラーの頻発さえなければ無料で使えて精度も高いだけに残念です。

CLOVA NoteはLINE社が開発した文字起こしアプリです。 
使用にはLINEによるログインが必要ですが、現在はβ版で全機能が無料で使えます。 

使用方法

1.LINEアカウントでログインします。

2.「新しいノート」をクリックし、「ファイルアップロード」で音声ファイルを選択します。

結果

レモンアカ。そんなにもあなたは レモンを待っていた。 
悲しく白く明るい 死の床で、私の手から取った一つのレモンを、 
あなたの綺麗な歯がガリリと噛んだ。 
トパーズ色の好機が立つ。  
その数滴の天のものなるレモンの汁は、ぱっとあなたの意識を正常にした。  
あなたの青くすんだ目がかすかに笑う。 
私の手を握るあなたの力の健康さよ。 
あなたの喉に嵐はあるが、こういう命の瀬戸際に、千恵子は元の知恵子となり、 生涯の愛を一瞬に傾けた。 
それからひと時、昔3点でしたような深呼吸を一つして、 あなたの期間はそれなり止まった。  
写真の前に挿した桜の花影に涼しく光るレモンを今日も 
おこ。昭和14年2月。

会議の議事録作成としての使用を念頭に置いているためか、テキストが小分けされてしまう点が難点です。
「哀歌」「置こう」という単語の変換を失敗したのは口語を前提としているからでしょうか。それ以外の漢字変換の精度は非常に高いと思いました。
CLOVA Noteは発言者が誰かを解釈することができるため、複数人の会話やインタビューなどの音声ならかなり便利に使えそうです。

冒頭に「高村光太郎作 智恵子抄より レモン哀歌」という台詞があるのですが、なぜか認識されませんでした。
挨拶みたいなものと解釈されたのでしょうか。

Nottaは音声ファイルだけでなく動画ファイルの対応やリアルタイムな文字起こしが可能なサービスです。 
有償プランでも比較的安価(1200円/月~)で使用できます。 

使用方法

1.会員登録時に使用した各種SNSアカウントかメールアドレスでログインします。

2.「インポート」をクリックし、音声ファイルをアップロードします。

結果

高村光太郎作智恵子抄より、レモン哀歌
そんなにもあなたは、レモンを待っていた。
悲しく、白く、明るい市のどこで、私の手から取った一つのレモンを
あなたの綺麗な歯がガリッと、神田トパーズ色の後期が立つ。
その数滴の店のものなるレモンの汁は、ぱっとあなたの意識を正常にした。 
 
あなたの青く澄んだ目が、かすかに笑う。私の手を握る、
あなたの力の健康作用あなたの喉に嵐はあるが、こういう命の瀬戸際に、
千恵子本野千恵子となり、生涯の愛を一瞬に傾けた。
それから、ひととき昔、3点でしたような深呼吸を一つして、あなたの期間は、それなり止まった。 
 
写真の前に差した桜の花影に、涼しく光るレモンを今日も
昭和14年2月  

NottaもCLOVA Noteと同じくテキストが小分けされてしまいます。
漢字変換が怪しい部分が多く、出来上がったテキストデータを使用する際には丁寧な査読をするなど注意が必要です。

AutoMemoはソースネクストが提供している文字起こしサービスです。 
同社のボイスレコーダー「オートメモ」シリーズの文字起こし機能のWeb版のようなものです。 

AutoMemoは音声ファイルのアップロードはPCから可能ですが、テキストデータのダウンロードは専用スマホアプリからでないとできません。
事前にアプリのインストールが必要です。

使用方法

1.会員登録時に使用した各種SNSアカウントでログインします。

2.音声ファイルを選択し、アップロードします。

3.「テキスト化を実行」をクリックします。

5.テキストデータは専用アプリからダウンロードできます。

結果

(A) 
高村幸太郎作知恵故障よりレモン愛か。 
そんなにもあなたはレモンを待っていた。 
悲しく白く明るい死のとこで、私の手からとった一つのレモンをあなたのきれいな歯がガリリと噛んだ、 
 
(A) 
トパーズ色の光輝が立つ。 
その数滴の天のものなるレモンの汁はあっとあなたの意識を正常にしたあなたの青く澄んだ目がかすかに笑う。 
私の手を握るあなたの力の健康さよ。 
あなたの喉に嵐はあるが、こういう命の瀬戸際に 
 
(A) 
知恵故は元の知恵故となり、生涯の愛を一瞬に傾けた。 
それからひととき昔三点でしたような深呼吸を一つしてあなたの気管はそれなり、止まった。 
 
(A) 
写真の前に差した桜の花陰に涼しく光るレモンを今日もおこう。 
昭和十四年二月。

AutoMemoもテキストが小分けされて生成されます。
気になる点としては、「智恵子」が人名と認識されていません。
文字起こしアプリによっては「辞書登録」という機能があり、頻出する単語を登録することで音声内に含まれる単語を優先的に登録した単語に変換することができるのですが、AutoMemoには辞書機能はありません。

今回使用したレモン哀歌の場合、間違え方は毎回「知恵故」なので辞書機能があれば簡単に解決できそうでしたが、惜しいところです。

MyEditはPowerDirectorやPowerDVDで知られるサイバーリンク社による文字起こしサービスです。 
文字起こしのほか、音声データのトリミングやノイズ除去といった加工、AIによる効果音作成やボイスチェンジなど多様な機能を提供しています。 
有料プランもありますが、580円/月と非常に安価です。 

使用方法

1.会員登録時に使用したメールアドレスか各種SNSアカウントでログインします。

2.音声ファイルを選択し、アップロードします。

3.「ダウンロード」をクリックすることでテキストデータがダウンロードできます。

結果

高村幸太郎咲く 
知恵。こしょうより 
レモン愛花 
そんなにもあなたは 
レモンを待っていた。 
悲しく、 
白く 
明るい 
死のとこで、 
私の手から取った一つの 
レモンを 
あなたの綺麗な歯が 
ガリリと 
噛んだ。 
ドパーズ色の後期 
が経つ。 
その数滴の 
天のものなるレモンの汁は 
パッとあなたの意識を 
正常にした。 
あなたの青く澄んだ目が 
かすかに 
笑う。 
私の手を握る。あなたの 
力の 
健康作用。 
あなたの喉に嵐はあるが、 
こういう命の瀬戸際に 
1,000恵子は 
元の知恵子となり、 
生涯の愛を 
一瞬に 
傾けた。 
それからひととき 
昔 
三点でしたような深呼吸を一つして、 
あなたの期間は 
それなり 
止まった。 
写真の前に刺した桜の花影に 
涼しく光るレモンを 
今日も 
置こう。 
昭和14年 
二月

サイバーリンク社が海外の企業のせいか、漢字変換がかなり怪しい結果となりました。
MyEditは文字起こし以外でも様々な機能があって面白そうではあるものの、漢字の入力し直しを考えると人力で文字起こしを行ったほうが早いような気も…。

有料アプリケーション 

無料で使用することはできませんが、動画編集で有名なAdobe Premiere Proにも文字起こし機能がありますのでこちらも試してみたいと思います。 
使用にはAdobe Creative Cloudの契約が必要です。 
 
2024年3月からまた値上げしたのでおすすめしにくくなってしまった…

Premiere ProはPhotoshopやIllustratorでおなじみのAdobe社が提供する、プロの現場でも使われている動画編集アプリケーションです。
動画編集については私自身ほとんど未経験でPremiere Proの機能の1割も把握できていませんが、文字起こし機能を使ってみたいと思います。

※ Premiere Pro 2024を使用しました

使用方法

1.Premiere Proを起動し、新規プロジェクトを作成します。
メニューの「ウインドウ」から「テキスト」を選び、テキストパネルを表示させます。

2.タイムラインパネルに音声ファイルをドラッグ&ドロップします。

3.テキストパネルの「文字起こし開始」をクリックします。

結果

高村光太郎作智恵子抄をよりレモン哀歌。そんなにもあなたはレモンを待っていた。哀しく白く明るい死の床で、私の手から取った一つのレモンをあなたのきれいな歯ががRIRIと噛んだトパーズ色の香気が立つ。その数滴の天のものなるレモンの汁はパンとあなたの意識を正常にしたあなたの青く澄んだ眼がかすかに笑う私の手を握るあなたの力の健康さよ。 
 
あなたの喉に嵐はあるが、こういう生命の瀬戸際に智恵子は素の智恵子となり、生涯の愛を一瞬に傾けた。それからひと時昔3点でしたような深呼吸を一つしてあなたの期間はそれなり止まった。写真の前にさした桜の花陰に涼しく光レモンを今日も雨をこう。 
 
昭和14年2月1日。 

さすがはAdobeとも言うべきでしょうか、かなり高精度の結果が得られました。
Premiere Proの費用以外のデメリットでは「ソフト自体の重さ」が挙げられます。軽快に使うためには大容量のメモリ、高速なSSD、ビデオカードが要求されます。

おまけ:清春の歌は文字起こしが可能だろうか?

今回使用した「レモン哀歌」はクリアな朗読で非常に聞き取りやすい音源データのため、いずれのアプリでも比較的良好な結果が得られました。
では、何を唄っているか聴き取りにくいことでお馴染みの清春さんの歌は文字起こしをするとどうなるでしょうか?

 Adobe Premiere Proに忘却の空のmp3データを読み込み、文字起こしを行ってみました。

 ※「忘却の空」は再録を行っていますが、今回は2003年発売のベストアルバム「GREATEST HITS 〜BEST OF 5 YEARS」からのmp3データを使用しています。再録バージョンはアコースティック色が強く、原曲よりも歌詞が聞き取りやすいと思います。

結果は……

※「フィラー」は「あー」や「えー」といった間を持たせるための発話を意味します(通常の読み上げではカットすべき部分)

面白い結果になるであろうことは予想していましたが、予想以上に原型をとどめない結果となってしまいました。
「空の下」「忘却」と一部でも聞き取れているだけでも評価すべきでしょうか。

得られた結果をよく見ると固有名詞が多いことにより、Premiere Proは文字起こしのために相当な単語数の辞書を内包しているものと考えられます。
つまり固有名詞を多く含む音声データの場合は強みを発揮するでしょう。


唄に特化した文字起こし(歌詞起こしと言うべきか)アプリもあるため、機会があれば使ってみたいと思います。

まとめ

ということで、今記事では文字起こしができるアプリ5+1選を実例をあわせてご紹介しました。 
文字起こしは時間と労力を伴う大変な作業ですので、こういったアプリもぜひお試しください。

当社ではWebサイト運営の負担を軽減するCMS「WebChanger」を開発しています。
こちらも日常業務の負担軽減に役立つアプリケーションですので、よろしくお願いいたします。

【関連記事】

ご相談・お問い合わせ

当社サービスについてのお問い合わせは下記までご連絡下さい。

お電話でのお問い合わせ

06-6121-7581 / 03-6415-8161