「日本語音声自動文字起こし」が実用的 Pixel 6とGroup Transcribeを比較

「日本語音声自動文字起こし」が実用的 Pixel 6とGroup Transcribeを比較

ついに日本語対応! Pixel 6の「レコーダー」アプリ

「レコーダー」はGoogle純正Pixelシリーズの標準アプリだ。音声の録音と文字起こしが同時にこなせる。Pixel 6シリーズに搭載されるGoogleが独自に設計したカスタムメイドのシステムICチップ「Tensor」は、高度な音声認識や画像処理をクラウドに頼ることなくスマホだけで速く・正確、かつセキュアに実現する。AI関連の処理に強いスマホであるPixel 6シリーズならではと言える目玉機能の一つがレコーダーアプリなのだ。

Pixel 6シリーズの登場以降、レコーダーアプリが英語のほか日本語、ドイツ語、フランス語の音声文字変換にも対応した。今後は端末ごとにレコーダーアプリの最適化を図りながら、Pixelシリーズの過去モデルにもアップデートを拡大する。

レコーダーアプリが待望の日本語対応を実現。2018年にGoogle Pixel 3シリーズが発売されてから、Pixelシリーズは日本でよく売れているというから、他のメジャーな言語よりも先に日本語対応が実現したのだろう

「日本語音声自動文字起こし」が実用的 Pixel 6とGroup Transcribeを比較

なおiPhoneにも「ボイスメモ」という音声レコーダーアプリがプリインストールされている。こちらのアプリは音声の録音に特化しており、音声の文字起こし機能はない。

Pixelシリーズのレコーダーアプリは、ライターである筆者の仕事にもはや欠かせない“武器”になった。アプリが日本語に対応する以前から、グローバル企業の発表会やインタビューを取材する機会にはいつもPixelシリーズを携えてレコーダーアプリを活用してきた。英語の音声文字認識が正確で信頼が置けるし、録音した音声ファイルをPixelシリーズからGoogleドライブを経由してMacに移して録音チェックの作業までがスムーズにできる。

レコーダーアプリの設定画面。音声文字変換の言語から日本語を選択できる。言語の右側、矢印のアイコンをタップすると辞書データを端末にダウンロードしてオフラインでもアプリが使えるようになる英語は“なまり”や語彙の違いに対応する5種類の辞書セットを用意。本稿を執筆している11月中旬時点ではほかに日本語・ドイツ語・フランス語が利用できる

英語の文字起こしデータはGoogleドキュメントやWordのテキストデータなどに変換、Macに転送してからDeepLなどの翻訳ツールを併用してインタビューの資料としている。

レコーダーアプリの日本語対応もまた言語認識の速さ、正確さともに十分実用的なレベルに達している。詳細はこのあとのハンズオンで触れたい。

音声から起こした文字データは、レコーダーアプリの中でフリーワード検索ができたり、参照する必要のない箇所の削除など簡易な編集もできる。音声データにもまた自動的に「話し声」「音楽」などのタグが付くので、意味のない音声箇所を飛ばしながら聞き直せる。

音声文字起こしデータのアプリ内フリーワード検索にも対応するアプリ内で文字起こしのテキストデータを先に切り貼り、削除してからテキストデータとして書き出すこともできる

また、音声文字変換の素材はGoogleドキュメントやテキストファイル形式でシェアできる。テキストではタイムスタンプや書式が消去されて、一続きの長大な文字の羅列になってしまうので、Googleドキュメントとして端末にいったん保存してから、Word(.docx)やリッテキスト形式(.rtf)のファイルとして保存、エクスポートする使い方が正解だ。

音声文字変換の素材はGoogleドキュメントやテキストファイル形式でシェアできる

音声と文字起こしのデータをミックスして最大5分までの「動画クリップ」が作れる機能も面白い。動画はそのままインタビューや対談のコンテンツを補足したり、プレビュー的な素材としても活用できそうだ。

レコーダーアプリのデータは音声、文字起こしのテキスト、および音声から簡易なテロップを起こして「動画クリップ」を作成できる最長5分までの録音データから、音声の波形と変換された文字をテロップにしたMP4形式の動画クリップが作成できる