データサイエンスとは何ですか:Q&A (富澤貞男)

 最近,「データサイエンスとは何ですか」というような質問を受けるようになりましたので,Q&Aの形式で以下に記載します.なお,A(回答)は公式なものではありません.私個人の少し偏った考えかもしれませんが,ご参考程度ということでご覧いただければ幸いです.

Q1
 データサイエンスとは何ですか?

A1
 昨今は世の中のいろいろな分野において多くのデータがあり,データを分析または解析して有用な情報を得ることは重要であります.そのためには,1つは,たとえば,統計学が必要と思いますが,しかし,日本では昔から統計の専門家が米国等と比較して極めて少ない状況でした.日本ではデータサイエンス教育が遅れ,皆さまご存じのように最近は急にデータサイエンス教育に力が入れ始められました.

 近年,通信機器の発達,ネットサービスの普及,情報技術などが急速に発展し,あらゆる分野(たとえば,医療・福祉分野,食品分野,コンビニ業界,物流分野,農業分野,観光,スポーツ,行政,保健,教育など)に大量のデータが日々蓄積されています.その膨大なデータから各分野・業界にとって有用な情報を引き出す必要があります.そのためには,データを分析または解析する必要があり,数理(数学),統計学,機械学習・AI(人工知能),情報学,計算機科学などの対象分野の専門的知識が必要です.

 今日,そしてこれからの社会において各分野・業界に従事している方だけでは,データを分析または解析して各分野・業界で抱えている課題を解決するための有用な情報を引き出すことが困難な場合があります.そのため,今すぐにもこの問題を解決する必要に迫られており,種々の分野・業界のデータを分析または解析できる専門的能力が求められています.種々の分野のデータの分析や解析に必要な科学(数理(数学),統計学,機械学習・AI, 情報学,計算機科学など)は「データサイエンス」と呼ばれています.


Q2
 大学におけるデータサイエンス学部の歴史を教えて下さい. いつ頃から設置されたのですか?

A2
 日本において,初の「データサイエンス学部」が2017年4月に滋賀大学に新設され,統計学がご専門の元東京大学の竹村彰通先生(元日本統計学会会長)が初代学部長に就任されました(竹村先生は現在は滋賀大学の学長です).また首都圏初のデータサイエンス学部が2018年4月に横浜市立大学に新設され,統計学がご専門の岩崎学先生(元応用統計学会会長)が初代学部長に就任されました.私立大学では,武蔵野大学に2019年4月にデータサイエンス学部が新設され,立正大学には2021年4月にデータサイエンス学部が新設されています.立正大学のデータサイエンス学部には統計学がご専門の渡辺美智子先生(元応用統計学会副会長)が所属しています.

 また,データサイエンス分野を専門に学ぶ学部がいくつかの大学に設置されています.たとえば,2018年4月に広島大学に「情報科学部」が新設されました.2020年4月には長崎大学に「情報データ科学部」が新設され,初代学部長に統計学がご専門の元九州大学の西井龍映先生が就任されました.

 さらに,2023年4月には女子大学では初の「データサイエンス学部」が京都女子大学に新設され,統計学がご専門の栗原考次先生(元日本計算機統計学会会長)が初代学部長に就任されました. また,同じく2023年4月に 明星大学 に日本初の「データサイエンス学環」が創設されました.この学環では 私(富澤)と中川智之 准教授が統計学に関する科目を担当しています.データサイエンス学部は1つの学部ですが,データサイエンス学環は複数の学部と連携・協力してして専門科目を設けており,学部と呼ばずに学環と呼ばれています.

 他にもデータサイエンス学部,〇〇データサイエンス学部や〇〇データサイエンス学科,データサイエンスコースなど,また,データ科学,情報科学などの学部や学科,またはコースなどが多くの大学に設置され始めています(詳細は省略します).


Q3
 データサイエンティストとは何ですか?

A3
 たとえば,医療分野において,新薬開発や新治療の開発において,臨床比較試験が行われ,統計学によるデータ分析に基づき新薬の有効性を証明することが必須であります.医療分野において医者,看護師,薬剤師,関連分野の多くの方々に,さらに高度な統計知識を持った臨床統計家(生物統計家や医療統計家ともいう)も加わって臨床試験を組み,統計的データ解析を行い,新薬の有効性などを科学的に結論付けて厚生労働省へ新薬申請することが行われています.このように医療分野のチームには高度な医療統計データの分析や解析ができる人も加わって,一緒に課題を解決しています.

 他の分野・業界(食品分野,コンビニ業界,物流分野,農業分野,スポーツ,行政,教育などあらゆる分野)においても,昨今では,各分野で日々膨大なデータが蓄積されています.しかし,その分野・業界に携わっている方だけでは,膨大なデータを分析または解析して,その分野にとって有用な情報を引き出し,課題を解決することは困難な場合があります.そのような課題を解決するために「橋渡し支援をする人」が必要です.つまり種々のデータの分析や解析ができて,かつ各分野・業界の課題を解決できる解を提案できる総合的な能力を持った人が必要です.そのような能力を持った人は「データサイエンティスト」と呼ばれています.

 たとえば,上述の臨床統計家(生物統計家)は、医師などの専門家と協力しながら,医療現場でかかえる重要課題に取り組むプロフェッショナルであり,医療現場におけるデータサイエンティストであります.

 各分野・業界において,データサイエンティストは,データサイエンスの高い能力・学力を持っていることに加えて,各分野・業界の課題が何なのかを理解して整理し,データの分析や解析を行い,その分野に有用な情報を見つけ出し,課題をどのように解決すれば良いのかの提案もできる幅広い能力が必要です.データを分析することにより,たとえば,食品業界・小売業界などにおいて,ある商品の売り上げ予測をするとか,また商品Aに関心ある人には,どのような別の商品Bにも関心があるのかなどのデータの分析や解析の能力も必要かと思います.

 これからの人間がより住みやすい未来社会(Society 5.0)の実現へ向けてのデータサイエンスが注目される昨今,種々の分野・業界においてデータサイエンティストの役割が重要です.

 現在,日本では数万人のデータサイエンティストが不足していると言われており,この先も毎年データサイエンティストの求人数は増え続ける傾向にあるようです.そのため日本の大学において,データサイエンスやデータ科学などの名が付く学部,学科,学環,コースなどは今や大変注目されています.


Q4
 「あなたは大学での専門は何ですか」と聞かれたら何と答えますか? 

A4
 たとえば,医学部の学生さんに対して,誰かに「あなたの専門は何ですか?」と聞かれたら,1つの答え方は,たとえば,「医学です」と答えられるのではと思います.さらに「医学部で何が専門ですか?」と聞かれたら,たとえば,「整形外科です」「小児科です」「眼科です」などの答え方をされるのではと思います.同様に,たとえば,情報学部の学生に対して,誰かに「あなたの専門は何ですか?」と聞かれたら,1つは「情報学です」と答えるのではと思います.さらに,特に何が専門ですかと聞かれたら,研究室配属された研究室の専門を答えのではと思います.たとえば,「統計学です」,「暗号理論です」,「AI(人工知能)です」などのように答えるかと思います.

 一般に大学での専門は何かと聞かれたら,研究室レベル,つまり研究室での専門を指す方が多いと思います.つまり,「浅く広い知識だけでなく」,大学では,研究室レベルで「深く学問を修める」ことが重要になってきます.就職する際も研究室での「専門的能力を深く身につけておく」ことが自己アピールのためにも重要かと思います.

 昨今,注目されているデータサイエンスやデータ科学などの名の付く学部,学科,学環,コースなどでは,1年次から4年次の卒業研究まで,データサイエンスなどの専門を数理的基礎から実践的応用まで幅広くかつ深く学び,卒業後に優秀なデータサイエンティストとして企業や行政等で活躍できる知識や能力をしっかりと身につけることができると思います.そして,「あなたが大学で学んだ専門は何ですか?」と聞かれたら,「専門はデータサイエンスです」や「専門はデータ科学です」などと名乗ることができるかと思います.さらに詳細に「研究室レベル」でのデータサイエンスの専門を名乗ることも可能と思います.

 これからのデータサイエンス時代にますます必要とされるデータサイエンスの専門家,プロフェッショナルのデータサイエンティストとして活躍したい人,また,データサイエンス業界のみならず,幅広い業界でその業界の専門家と一緒になってデータ分析やアドバイスできる職業人を目指したい人,あるいは必ずしもデータサイエンティストを目指さなくてもデータサイエンスの高い専門能力を身につけたい方,これからの時代にますます必要なデータサイエンスに関心ある方は データサイエンスやデータ科学などが専門の学部,学科,学環,コースなどに入学し,データサイエンスの専門的知識をしっかりと身につけられるのが良いのではと思います.


Q5
 「信頼される」優秀なデータサイエンティストやデータサイエンスの専門家になるためには,重要なのは何ですか? 

A5
 多くのデータ分析手法の中から,あるAという分析法を用いて,その結果報告や提案等(たとえば,将来の収入予測等)を担当者にしたとき,その理由を聞かれたり,何か質問されたとき,その分析手法の妥当性やその方法の説明,そして使用した科学的(数理的)根拠などを,自信を持って答える必要があるかと思います.もし担当者が理系出身の方でしたら,そのデータサイエンティストに数理的な質問もするかと思います.その場合,「私には数理的な詳細はわかりません」では,正しく分析できても,信頼される優秀なデータサイエンティストといえないかもしれません.

 単に優秀だけではなく,「信頼される」優秀なデータサイエンティストやデータサイエンスの専門家を目指すためには,浅く広く学ぶことだけでなく,専門的に基礎と応用を深く身につけることが重要かと思います.そのためには,基礎は数理面の知識をしっかりと身につけることが重要です.立派な家を建てるには家の土台をしっかりと作ることが重要です.それと同様かと思います.

 大学4年間は,時間が自由にたっぷりとあります.だからこそ,人生でこの4年間でしか学べないことを重視する必要があります.つまり,深い基礎教育(家の土台部分)が最も重要です.卒業してからでは,学生時代のような十分な時間も無く,頭も固くなり,卒業後に基礎的な知識を十分に身につけることはほぼ不可能と思います.逆に応用面は卒業してからでも身につく可能性はあります.もちろん応用面を在学中に身につけることは大切でありますが,応用面を十分理解するためには,基礎的な能力が必要であります.

 大学では,「数理面」を重視した基礎教育もしっかりと学び身につけることが,「信頼される」優秀なデータサイエンティストやデータサイエンスの専門家として活躍するために大変重要であると思います. 

 戻る