あるデータサイエンティストの実態
企業で活躍されてるデータサイエンティストにその仕事内容や必要となる素養について紹介していただきます。
濱崎さん:テクノスデータサイエンス・エンジニアリング(以下TDSE)の濱崎です。今回は同僚の大川さんと一緒にデータサイエンティストという職業を紹介します
大川さん:TDSEの大川です。早速ですが、濱崎さんは普段どのように働いていますか?
濱崎さん:データ分析に特化したコンサルタントとして、お客様先の企業でビジネス課題の解決に向けたプロジェクトを結成し、仕事をしています。
最近はプロジェクトの企画設計や進捗管理など、プロジェクトマネジメント寄りのタスクを多くこなしています。
大川さん:データサイエンスっぽい要素が全然出てきていませんね(笑)。
濱崎さん:これから説明します(笑)。
私たちはビジネス課題解決の一つの方法として、データサイエンスに基づくアプローチを取っています。これまでのビジネスにおける分析において、企業はデータの集計やグラフ作成等の「データの可視化」を行い、それをビジネスの意思決定に活用してきました。
例えば、月別売上高を集計し、売上が減っているようであれば売上UPのための施策を打つ、という意思決定をするとか。
最近はそこから一歩進んで、「過去のデータをAIに学習させ、そのAIを使って未来を予測する」ことで、ビジネスの意思決定をより精度良く行おうとする試みが増えています。その試みを支援するのが私たちの仕事です。
大川さん:データサイエンスについてもう少し掘り下げてみましょうか。私は、データサイエンスとは「機械学習や統計学+IT技術」だと思っています。
「過去のデータをAIに学習させ、そのAIを使って未来を予測する」の部分では機械学習や統計の理論を使用しています。これらは広い意味で数理科学に属する理論です。一方で、AIを作成するために必要なデータの蓄積や計算の実行にはIT技術が重要です。だから「数学の素養」と「IT技術」はデータサイエンティストに必須の素養だと思っています。
濱崎さん:私も「数学の素養」と「IT技術」は必須の素養だと思います。データサイエンティストとして働くためには、さらに「ビジネスの素養」も重要です。
ビジネス課題を解決するためには、事業内容の深い理解が求められます。お客様に分析結果や進捗の報告を行うためには、ドキュメント作成やプレゼンテーションも重要になります。これらもビジネスの素養の一部といえるかもしれません。
大川さん:抽象的な話が続いたので、「データサイエンスのビジネスの意思決定への応用」について、イメージしやすい例はありますか?
濱崎さん:では「営業活動効率化」の例について話します。訪問先が複数あり、そこで契約を取る事が営業の仕事だとしましょう。営業はなるべく契約が取りやすい所に優先して行きたい。そこで過去の営業の行動データから、どこの訪問先に営業活動をかけると契約が取れやすいか?を予測する。予測に基づいた営業活動を実施することで、営業の行動が効率化されて、売り上げの向上が期待できる。実際には、分析の結果を利用して効率の改善が図れたかの検証作業もとても重要になります。
数理女子の記事ということで、最後に数学に関係が深い部分も話しましょうか。機械学習ってどんな理論なんでしょう?
大川さん:機械学習とはざっくりいうと、「データの関係性」を求めることです。先ほどの営業行動の例でいくと、「営業の行動」と「契約」がどのような「関係性」にあるかを求めたい。機械学習を使うと「営業の行動」から「契約するか否か」への対応を近似的に表現出来ます。ここで現れた「対応」とは数学的には関数に他なりません。最近AIという言葉がよくニュースで登場しますが、AIとは大雑把には関数のことだったわけです。
ね、数学でしょ?
テクノスデータサイエンス・エンジニアリング株式会社
データサイエンスグループ所属
濱崎菜都美 筑波大学大学院数理物質科学研究科物理学専攻(理学修士)
大川幸男 東京大学大学院数理科学研究科数理科学専攻(数理科学博士)
※2019年3月掲載。情報は記事執筆時に基づき、現在では異なる場合があります。
著者略歴
データサイエンスグループ所属