英語書き起こしサービスを使ってみた

英語学習の延長でネイティブのしゃべるYouTubeの動画でディクテーションをしたいと考えたが、答えがわからないので困っていた

今までYouTubeの自動生成字幕やOtter.aiなどのAIベースの自動認識サービスは使っていたが、明らかな誤認識も当然チラホラ

という流れで動画の文脈を読んだ上でネイティブに動画の内容を書き起こしてもらえるサービスがないか探して実際に使ってみた

まず日本語で「英語 書き起こし」と検索

料金は「納期」と「分数」ベースで決まるようで、最安相場は納期5日で150円/分

思ったより安かったが英語で展開しているところも調べた

英語で「transcription service」と検索

出てくるサイトは日本のものよりも、かなり安い

とりあえず目についたところ以下3つに同じファイルを投げて試した

依頼

音声の内容

YouTubeにあった5分程度のアメリカ人女性二人の雑談動画。日常会話そのもので、専門用語等は一切ない。

人の著作物を勝手に法的にこういうサービスに投げるのはどうなのか分からないが、秘密保持契約があるのでバラされることはないはず。問題あったら捕まえてください。

今回依頼した業者

scribie

料金:$0.8/分 

とにかく安い。登録すると$10分のクレジットまでもらえる

大丈夫?

Rev

料金:$1.25/分

日本の業者レベルに高いが

高いなりにクオリティがいいんじゃないかと勝手に期待

GoTranscript

料金:$1.08/分

起こし手に参加するためのテストがかなり難しいらしいという情報があり、クオリティに期待

10%引きクーポンがググるとでてくるので、適用で$0.97/分くらいになった。何回でも使える。また、支払いをPayPalですると1%キャッシュバック。

依頼方法

日本のサイトはどこも「まずファイルの内容を教えてもらって、プランを選んだらこちらから1時間位で見積もりだしますので承認してください・・・」というめんどくさい流れになっていたが、

今回使ったサイトでは、動画や音声ファイル(YouTube動画などインターネットのソースも選択可能)を選択し、プランを選んで支払ったらすぐに始まる。ウェブベースのYouTubeの動画ダウンローダ使ったことありますか?あれと同じノリです。お金かかりますけど。

どんな専門的な内容でも時間で一律で料金が決まる。すごいです。

結果

納期

納期は全て5日程度となっていたが、内容が5分と短いこともあってか、全て12時間以内に返ってきた

scribie: 12時間、rev: 3時間、gotranscript: 5時間

内容

3つ頼んで内容を比べて見てわかったのは

Revが高い上に微妙ということでした。

やたら早いなとは思ったのですが、内容がダメでした。

まず、体裁が整ってないです

ScribieとGoTranscriptでは、彼らの一貫した規則に沿ってきれいに起こされているのですが、Revから返ってきたものは、ケバ取り(you know, likeなどの省略)がされていたりされていなかったり、ヘンなスペースが入ってたりする

肝心の内容も他の2つと見比べてもこれ違うくね?って部分多数。自動認識のほうが優秀まである。というか自動認識されたものを適当に手直ししただけっぽい

Revから返ってきた文字起こしで実際に含まれれいた間違い パッと見て気づいたもの 正->誤

devices -> viruses

take it off -> think it off

nail polish -> nail Polish

I'll (like) do something -> I like do something

単数形 -> 複数形, 複数形 -> 単数形

GoTranscriptとscribeではしっかりと起こされていたのでもし聞き取れなかったとしても、文脈から推測できたはずだ

100歩譲って内容は頑張ってもどうにもならないこともあるかもしれないが、フォーマットは整えられるはず。やっつけ仕事をされた感がすごい。

Revでは書き起こしに99%の精度があることを標榜しているが、よく言ったもので、ここまで間違えていても単語ごとに見ていけば確かに99%以上の精度はある

他の2業者は(それぞれちょっとしたゆれはあるものの)完璧で、速さを求めるならGoTranscript、ゆっくり最安を求めるならscribieをこれからも使っていきたい。

その後、Revで返却後のファイルに★2の評価をつけ(拙者★1ビビってつけられない侍)、コメントにこんなもの返金に値するみたいなことを書いたら、メールが届き、「確認したらひどい間違いがあったのでやり直させてください!お代はもちろん入りません!」的なメールが届いた

f:id:ogureho:20210726153326p:plain

リテイクは12時間位で返却され、直ってないものあったが、GoTranscriptとScrabieと同じくだいのクオリティのものが返ってきた。

まとめ

どうやらどのサイトも書き起こし手はネットで用意されたテストを解くだけで参加できるようだ。つまり準ネイティブレベルの人や、ネットに落ちてるカンペ見まくってテストを突破するクソ大学生みたいなヤツでも参加できる。

テストに合格した書き起こし手は、プラットフォームから作業待ちのファイルを聞いて自分にできそうな題材なら受けるといった形のよう

というわけで、Revみたいなことはどのサイトでも起こるということです。準ネイティブで真面目にやってる人もいれば、ネイティブでも適当にやってる人もいたりいろんな人がいると思うのですが、そんな客としてはそんな事情知らない。ただ、不真面目なやつがいるのを見越してクオリティチェックをするべきなのに、Revは高いわりにそれをしていないのかなって思っちゃいました

そもそも報酬が低いので、英語を第一言語とする多くの国の人たちにとっては、文字起こしはあまり魅力的な仕事ではない。だから、このサイトではネイティブにやってもらいたいという願いはかなわないかも

ココナラなどスキルマーケットサイトでバックグラウンドを公開している人たちに100円/分~くらいで頼めるみたいなので、こっちのほうがいいかもしれない(ただ、やりとりしなければならずめんどくさいし、恥ずかしい)