👽

オフラインデータでユニコーン企業に俺たちはなる!

自己紹介

フェズのチーフデータサイエンティスト/R&DグループGMの松﨑 遥です。微分と積分が得意です。初めての投稿になりますのでフェズにジョインした理由などを語ろうと思います。
 

アカデミックを飛び出した理由 a.k.a. 老害トーク

10年前、研究者になりたかった僕は、修論を落とし、留年した。単位は取れてしまっていたので、ニートのような状態になり、手持ち無沙汰になった。(1年後なぜか同じ修論が通り卒業できた)
ありがたいことに、起業していた研究室の先輩が助けてくれて、その会社で働くことになった。
 
その年は、iPhoneが日本で発売開始した年だった。ベンチャー界隈ではまだiPhoneの波に追いつけておらず、「ガラケー」向けのゲームなどが開発されていたように思う。
 
日本では1990年ぐらいにインターネットが始まったが、一部のオタクしか使っていなかった。
インターネットが無かった時代を、想像できるだろうか?
それと同様に、iPhoneが無いという今では想像も出来ない時代を僕たちは過ごしていた。
 
奨学金の残りが余っていたので、それを使ってiPhoneを買った。僕は、ワクワクしていた。10年後、当時はイケてるベンチャー程度だったDeNA・Rakuten・Cyber Agentは、日本を代表する大企業になった。僕はよくわからないままデータサイエンティストになっていました。
 

 

データサイエンスをはじめた個人的なきっかけ

いつ、どうしてデータサイエンスを自分は始めたのか。
 
日本でのiPhoneが発売されたのは2011年。そこから数年の人生を振り返ってみようと思う。
 
まず、2011年。先輩の会社はすぐに傾いた。メンバーは大学の先生になったり、しばらくバリ島に住むことにしたり、山奥で古武術・手裏剣の修行に励んだり(修行の結果、のちに小林秀雄賞を受賞)と、散り散りになった。僕はBtoBの会社に入ってコードを売ることにした。
さらに2年も経つと、プログラミングに慣れてしまった。一応は中学の時からZ80のアセンブリ言語を書いていて、仕事でやるのも趣味でやるのも大差ないように思えた。
 
自分がプログラマなのかわからなくなるまで、いろいろやった。ペアプログラミングのドライバーをして全社巡りをしたり、お客様先にスーツを着て伺ってみたり、大阪に行って複数のお客様の前で喋って質問攻めに窮したり、実装しきれないほどの壮大な開発ロードマップを書いたりして、もがいていた。
2013年になった。自分は腐りかけていたのかもしれない。なぜ数学科を出たのに、データベースに書き込んで読み込むだけの仕事をしなきゃいけないのだろうか(おい)。自分で決めたのに、勝手なものである。
僕は何か新しいものを探していて、飢えていた。
 
そんな時、2012年に、Googleが「猫の顔の概念」を学習した、という論文が流れてきた。 https://storage.googleapis.com/pub-tools-public-publication-data/pdf/38115.pdf
2010年、社会に出る前、僕はGoogle Mapが標識をSupport Vector Machineで学習したという論文を大学の図書館で既に読んでいた。 https://link.springer.com/chapter/10.1007/978-3-642-22726-4_36
僕は何かに導かれるように機械学習の世界に引き寄せられていたような気がして2014年に自宅にPC5台からなるHadoopクラスタを作った。
それ以降は色々勉強しつつデータサイエンティストをやっている。
 

 

データサイエンスの発展の歴史を俯瞰する

その頃、世間では何が起きていたかを振り返ってみたい。
 
まずはITの花形であった、ゲームの世界。
2010年に始まったスマートフォン向けゲーム市場は爆発的に成長し、各社にキャッシュが溢れ、壮大な技術投資が始まった。初めはゲームによって生成されるペタバイトサイズのビッグデータを扱う分散コンピューティング基盤に投資が集中し、次第に投資はアルゴリズムへ軸足を移していったように思う。
 
2014年ごろにはすでに、DeNAがゲームのレベルデザインを機械学習するようになっていた。ロジスティック回帰とか決定木とかSVMを使っていたような時代である。
2017年になると、Kingというアメリカの会社が、レベルデザインどころかマップデザインをDeep Q Networkで生成するようになった。
人間は、AIで生成されたゲームに熱狂し、Kingは世界で最も課金されたソシャゲになった。
流石にこれはマズいだろうということに、世界中の人が気付き始めた。AIはゲーム業界で爆発的に発展したが、その波は落ち着き、AIの「より良い目的への転用法」が模索されるようになった。
 
AIを爆発的に発展させたもう一つの業界は、広告の世界である。
Googleが2003年に始めたオンライン広告はAIによって強力になりすぎ、欧州での反発 - GDPRを産んだ。GDPRはほぼオンライン広告による機械学習を不可能にする。GDPRは2018年に発効した。2023年に、スマートフォンからのCookie取得は完全に停止される予定だ。

 

次に来るのはオフラインデータ

この2つの小話から、若い=今後10年以内に大学・大学院を卒業するデータサイエンティストたちには「オフラインを機械学習すること」を薦めたい。
 
  • 自分が研究室をドロップアウトした10年前、たまたまiPhoneが発売したてでなければ、プログラマーにはなっていないだろう。
    • だから今自分が学生に戻ったら、もう飽和したレッドオーシャンであるオンラインデータのデータサイエンスの業界=ゲーム業界・オンライン広告業界には就職しないだろう。
    • とはいえ、優秀な30代のプレイヤーは現状ゲーム業界・オンライン広告業界に集まっており、彼らから学ぶという修行目的で就職するという選択肢はアリであるが
    • こんなことを、先輩に拾われた元ニートの自分が偉そうに語っていいのかわからなくなったのでやめておこう。
  • 就活における意思決定でこれからの自分の10年のキャリアが決まるなら、少なくともGDPRによる今後10年の世の中の流れを読んで決めるべきだろう。
    • 1st Party Data
    • Offline Data
 
データを取得される個人はデータの二次利用を断れるようになる。その帰結として、企業が分析企業に依頼などを出来なくなる。1st Party Dataとは例えば小売業者で取得されるデータであり、小売業者自らが活用することだけが許されるという世界観である。
 
オフラインとは、いまだインターネット上でデータが取得できないデータのことである。
  • 自動運転データ
  • 店頭データ
  • 工場内データ
  • 医療・生体デバイスデータ
  • ロボット端末内データ
テーブルコンペではないデータ、と言ってもいいかもしれない。
 
タイミングは重要である。先見の明がありすぎた後輩は10年前にロボットでスタートアップを起業し、Googleに対しexitしたが、技術レベルとしては尚早で、解散されてしまった。早すぎて難しすぎて実現不可能なのも良くないのかも知れない。
 
正しくリスクをとって技術を当てれば、同年代のエンジニア平均の数倍の給与を得ることができるのかも知れない。そして、世界で自分だけしか知らないことをを発見して楽しくやれるのかもしれない。2010年から花開いたバブルが落ち着いてみると、そこかしこに1億円以上の資産を持つ富裕層が誕生していたし、当時活躍したイノベーターが今の日本の技術界を代表しているというのもまた事実だ。
 
最後は自分で考え、リスクを取るしかないが、自分はギャンブラー気質なのか、常にリスクの高い方へと引き寄せられてしまうのであった。

 

次回予告

フェズではゲームや広告で発展したAI技術をオフライン店舗に転用している。
今後はそうしたこともこのブログに載せていきたい。