昨年大いに話題になったAIの活用は、2024年も更に進んでいくと思われます。荒川印刷においても、業務での活用だけではなくコンテンツの作成やサービスとして提供することも増えてきました。
先日、サービスとして提供した事例をご紹介します。
会議やリモート通話の内容を議事録として作成することがあると思います。議事録の作成は、会議で決まった内容を共有し、次のアクションを確認するためには重要です。
ただし、議事録の作成もなかなか労力がかかります。以前より会議の内容をレコーダーなどで録音したものを提供いただき、その音源をから文字起こしさせていただく業務を請け負うこともありました。
ライターが録音を聴きながら文字起こししていきますが、会議の録音時間に応じて金額が上がっていく上に、納品まで少し時間がかかってしまいます。
ここでもAIを活用することで省力化が可能です。今回、インタビュー音源を文字起こしする業務を請け負いました。文字起こした内容は、そのまま使うわけではなく、原稿にまとめ直すための資料となるものです。正確に一字一句を書き起こすよりも素早く納品することも重要でした。
そこで、AIによる文字起こしを利用し、即日納品を行いました。固有名詞や専門用語などは修正が必要になってくるため、全自動で納品とはなりませんが、納品までの時間は劇的に短縮できました。
提供いただいた音声を聴き取りやすく少し補正し、音声をアップロードして少し待つと、AIが全体の文字起こしを行います。このままでも内容の要旨は十分に理解できるものですが、ざっと1.5枚程度で聴き直しながら、固有名詞などの修正を行なって納品しました。
今回は、文字起こした内容を書き出して、修正した上でWordファイルなどで納品しましたが、今回の作業で新しい可能性を見出すことができました。
AIでの文字起こしはWEB上の文字起こしサービスを利用しました。文字起こしの修正もWEB上で可能です。複数箇所を一括で置換することもできるものです。
面白いのは、パスワード制限を掛けたページで、アップロードした音源も確認できます。文章にマウスを乗せるとメニューが表示され、その部分の音声を再生もできます。
編集ボタンで文字の修正も聴きながら編集でき、共有リンクで関係者に確認のため共有もできます。この部分、聞き取れなかったのですが、なんと言っているかの確認などもその部分の音声を指し示すことができるので、作業がしやすくなります。
なお、上記の文字起こしは、文字の修正を行っていないものです。その精度に驚きます。AI技術の進歩により、文字起こしの精度が飛躍的に向上しているのが分かります。
文字起こしをしたものをそのままWEBで共有する新しい可能性も感じます。
上記のサービスは、会議用のサービスではないので、通常は公開する利用ができるものですが、非公開としてパスワードをかけて関係者だけが聞けるものとしても運用できます。会議ごとに音声の書き出しを行って、ブログ記事のようにアーカイブとして残しておくことができるのですが、これが便利です。
過去の会議も含めて、文字起こしをした内容から検索ができるのです。
「この話題、以前の会議でも話が出たような気がする」「前回、この話題はどういう内容だっただろうか」「前にこの話が出たのはいつだったか」
文字起こしされているからこそ、会話の内容を過去のものも縦断して検索できるのです。
会議の内容を簡潔に議事録としてまとめることも重要ですが、ニュアンスや話の流れとして音声と文字起こし内容をアーカイブしておくことをおすすめしたいと感じました。
もちろん、音声を残しておけば聞き返すことは可能ですが、長い会議になった場合、聞き返したい箇所をどこで話していたかを探すのは容易ではありません。文字起こしすることで検索できることは予想以上に有用です。
文字起こしの修正を十分にしなくても、アーカイブとしてAIに文字起こしをさせておき、必要に応じでいつでも参照できるようにしておくことは、便利ではないでしょうか?
荒川印刷では、このようなAIでの文字起こしのサービスのほか、AIによる音声合成を利用した動画ナレーションも活用しています。
AIでの音声の文字起こしや、音声読み上げに興味がありましたら、サンプルなども用意できますので、お気軽にお問い合わせください。