ウィキペディアによると、『データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う』ことがデータサイエンスだと書いてある。
そんなデータサイエンスに従事する人はデータサイエンティストと呼ばれ、2012年ハーバード・ビジネス・レビュー誌で『21世紀で最もカッコいい仕事』と持て囃されたこともある。
GoogleTrendsでデータサイエンティストとデータサイエンスを検索可能な2004年以降で見ると、
データサイエンスは昔からあるが、データサイエンティストは最近のことばだと分かる。
さて、こんな記事があった。
文系記者が「データサイエンティスト育成スクール」に通った結果 2019年8月20日
「スクールはデータ分析に価値があると思っている人たちが集まっている」という事実を忘れてはいけない。授業の中では「そもそもデータ分析をすることに何の意味があるのか」を問われたり、「データ分析をする意味がない問題を分析する」こともない。しかし、実務ではそうした壁にぶち当たることも多いはずだ。
データと呼ぶとカッコいいが、要は過去の情報だ。
実際には現在の情報を連続的に収集し一定量を分析するので、行動やプロセスが発生し時間差が生じるので、結果的には過去の分析になる。
上記の記事に対してネット上では、儲かるのはデータサイエンティストではなく、データサイエンティスト育成業界だと揶揄する声も多く上がっていた。
データサイエンスが統計学を利用するということで思い出したのがテレビの視聴率調査。
テレビの視聴率調査もデータサイエンスに違いないと感じた。
日本ではテレビの視聴率調査は、2000年の3月以降ビデオリサーチ1社が視聴率測定を行なっている。
そんなビデオリサーチ社は、データサイエンス事業に特化した新会社「株式会社Delta Values (デルタバリューズ)」を2018年4月2日に設立した。
さぞかし話題になってるかと思えば検索しても大した話題は出てこない。
サイトを見るとクライアントは、大手広告会社 / 大手媒体社 / 医療関連機関 / 大学 etc.、となっている。
出来たばかりの会社だから業績云々はどうでも良いと思うが、出てくるのはこんな情報ばかりで、世間の注目を集めてるとは言い難いものばかり。
株式会社Delta Values 第1期決算公告
— 官報決算データベース (@kessan_db) June 26, 2019
東京都中央区
純利益:80万4000円
利益剰余金:80万4000円
総資産:1億1630万7000円https://t.co/7AJzBtFMmQ
そう言えばと思い出したのが、最近話題になっていた内定辞退率の予測。
これこそデータサイエンスで、データサイエンティストが導いたデータ活用だとすると、世間の陽の当たる場所が活躍の舞台ではないのかもしれない
リクナビの就活生「内定辞退率」予測データを、アフラック生命保険とりそなHDが購入していたことが分かりました。金融機関の判明は初めて。ほかにNTTコムウェア、NTTファシリティーズも買っていました。https://t.co/d5EVNm4k1J
— 日本経済新聞 電子版 (@nikkei) August 14, 2019
ところで、内定辞退予測はどのように分析されたのかというと、
ある人が就活の時期に、リクナビのサイトで各社のサイトを閲覧したとして、「内定が出て実際にその会社に就職した場合、その会社の閲覧パターン」「内定したが辞退した場合、その会社の閲覧パターン」などをAIを使って、つまり相当に大きなデータを統計処理する形で集めていったのでしょう。その上で、全体的なパターンを分析していったのだと思います。
と推測されている。
内定辞退予測に関してはデータを駆使してまで知りたいことは、ターゲットとなる人物の「知られたくない情報」だと言えそう。
知られたくないと言っても、別に汚点や恥ずかしいことではなく、他社への関心の度合い。
まるで浮気を疑って興信所に調査を依頼するような感じだ。
そういう意味では、ニーズは古典的だと言える。
古典的な分野にこのようなデータの活用が進むと、そんなつもりがなかった人はトバッチリを受けることになるだろう。
真のデータサイエンティストは日陰の裏稼業で活躍し、陽の当たる表舞台ではデータサイエンティスト育成事業が活躍しているのかもしれない。