自動文字起こしが当たり前になった今でも、「最後は人の手が必要だ」と感じる場面は少なくありません。雑音、早口、訛り、話者が重なるといった状況で、精度が一気に崩れる瞬間が現場には残っています。
音声文字起こしサービス「Scribie」も、最初から順調だったわけではありません。12年以上続けても成長の道筋が見えず、価格競争にも押され、苦しい時期が長く続きました。それでも同社は、年商約1.6億円($1 million)規模にまで成長しています。
転機は「技術」ではなく、他の要因にありました。何が成長を止め、何が追い風を確かな成果につなげたのか。その中身を追います。
音声を文字にする仕事のあり方が変わり始めた
会話やインタビュー、動画の音声を文字に直すと、あとで必要な部分を探しやすくなる。記事を書いたり、短い投稿文を作ったりもしやすくなる。
少し前までは、音声を聞きながら人が全部タイピングするのが当たり前だった。だが今は、音声がはっきりしていれば、コンピューターがかなりの精度で一気に文字にできる。
それでも現場では、最後は人の手が必要な場面が多い。雑音、早口、訛り、話がかぶる瞬間——こういうところで、自動の文字起こしは急に弱くなる。
この世界で長く戦ってきたのが、インド出身の技術者ラジブ・ポッダール。音声文字起こしサービス「Scribie」を作った人物だ。
ただし、最初の10年は順風満帆とはほど遠かった。大きな会社や、外から大金を集めた会社がどんどん成長する一方で、Scribieは思うように広がらない。生活面の悩みも重なり、「このままじゃいけない」という焦りが積もっていった。
寝室から始まったScribie
ラジブがScribieを始めたのは2007年。もともとプログラマーとして経験があり、大手企業で働いたこともあった。
別の事業がうまくいかず、家計を支えるための「最後の手段」として、寝室でサービスを作り始めた。ちょうどその頃、通話を録音する仕組みが広まり始めていた。録音した音声を「文字にしてほしい」という人が増える。ラジブはそこに賭けた。
読みは当たった。当時は文字起こしの単価が高く、1件約1.4万円($90)ほどで受けていたこともあった。今の相場とは大きく異なる。
その後、自動文字起こしの技術が進んでも、ラジブは急に会社を大きくしなかった。2013年までオフィスすら持たず、寝室とパソコンで十分だと考えていた。
ところが2019年、空気が変わる。私生活の問題が重なり、さらに大手サービスが自動化を武器に価格を下げてきた。12年以上続けてきたのに、成長の道筋が見えなくなった。
ラジブは悩んだ。「人が作業する以上、ミスはゼロにならない」。なのに、仕組みだけをいじって人の作業量を増やそうとしてもうまくいかない。競合のほうが、人を使った作業の回し方がうまかった。
「技術の問題ではない」と気づく
新しい考え方が必要だと感じたラジブは、2019年に、幻覚作用のある成分を含むきのこを使った体験に関心を持ち始めた。体験談や本を読み、やり方や注意点も学んだという。誰にでも合うものではなく、知識なしに試すべきではない、とも話している。
実際に体験したあと、頭の中の見え方が変わった。Scribieの成長を止めていた原因は、技術や仕組みの弱さではなく、「人の扱い方」だったと気づく。
ラジブはそれまで、文字起こしをする人たちを、同じ動きを繰り返す機械のように扱おうとしていた。だが現実の人間には得意不得意があるし、気持ちもある。思いやりを持ち、成長できるよう支える必要がある。そこにやっと目が向いた。
この体験をきっかけに、生活習慣も変えた。電子タバコをやめ、酒もやめ、体重が落ちた。ヨガと瞑想も始めたという。
そして事業のやり方を見直していた時期に、新型コロナが広がった。オンライン会議が一気に増え、「会議の内容を文字にしたい」という需要が爆発した。Scribieにも追い風が吹いた。
自動化が進んでも、人の手が必要な理由
自動の文字起こしは便利だが、音声の質に強く左右される。雑音が多い、話し方にクセがある、発音が聞き取りづらい——こうなると誤変換が増える。
ラジブは、オンライン会議の自動文字起こし機能の精度は95%程度だと見る。一方、人が確認しながら仕上げると99%まで上げられる。この差は小さく見えて、使う側にとっては大きい。
ただし、人が関わるサービスはコストがかかる。大手の自動サービスが安い料金で出てくると、同じ土俵では勝ちにくい。
そこでラジブは、精度の数字だけを追いかけない。大事なのは利用者が満足しているかどうか。問題があれば直す。そういう姿勢が、不満を大きくしないと考えている。
Scribieの武器は「4段階チェック」
Scribieの特徴は、人の作業を重視し、4段階で確認する流れを作ったことだ。
音声を小さな部分に分け、段階ごとに別の担当者が見直す。昔は「1人が作って、もう1人が確認する」2段階が一般的だった。ラジブはそこに3人目、4人目を加えた。
さらに時代に合わせ、最初の下書きはコンピューターで作る。そのあと人が順番に直していき、最後は一番うまい人たちが品質を確認する。
この仕組みにはもう一つ狙いがある。作業者が上達して上の段階に進めるようにすることだ。上の段階ほど短い時間で効率よく稼げるようにしたい、という考えがある。
Scribieには、毎月作業する人が約7,000人いる。登録して試験を通った人まで含めるともっと多い。人数が多いほど、空いている人に仕事を回しやすくなる。
作業者はログインすると、やりたい仕事を選べる。さらに、どの人がどんな話し方や発音に強いかを過去の結果から把握し、得意な人に合った仕事が届きやすいようにしている。
昔は「誰がやっても同じ結果」を目指していた。しかし、人は多様で、完全にそろえるのは無理がある。そこで発想を変え、「得意を生かす」方向に切り替えた。
宣伝よりも、仕組みで回す
利用者の多くは検索から自然にやってくる。特別な広告を打たなくても、長年の実績や過去に書いた記事が集客につながっているようだ。
作業者についても、ラジブは早い段階で「紹介で増える仕組み」を用意した。自分で必死に探し回るより、自然に人が集まる流れを作った。
2019年ごろは、ラジブとフィリピンの外部スタッフ2人で回していた。そこからチームは増え、アメリカの共同オフィスも使うようになったという。
次の山と、起業する人への言葉
Scribieは年商約1.6億円($1 million)規模に届いた。ラジブは「次の段階に入った感覚がある」と言う。次の目標は年商約8億円($5 million)。そのためには運営体制を作り直す必要があると考えている。
これまで大きな外部資金に頼らずに続けてきたが、資金集めに挑戦した時期もあった。ただ当時は、「どこまで大きくできるか」という問いに、自信を持って答えられなかった。それが結果に影響したかもしれない、と振り返る。
今は、外部資金が成長を速めることもあると考える。競合が急成長した背景にも、外部資金の力があったとみている。
最後にラジブが強く言うのは、始めるなら「好きで続けられること」を選べ、ということだ。好きになれないなら無理に続けないほうがいい。楽しめることをやったほうが、長く走れる。
そして、外部資金に頼らず進めるやり方には、無駄を減らし、本当に必要なところに集中する力が育つ、とも語っている。
