最近,「データサイエンスとは何ですか」というような質問を受けるようになりましたので,Q&Aの形式で以下に記載します.なお,A(回答)は公式なものではありません.私個人の少し偏った考えかもしれませんが,ご参考程度ということでご覧いただければ幸いです.
Q1
データサイエンスとは何ですか?
A1
昨今は世の中のいろいろな分野において多くのデータがあり,データを分析または解析して有用な情報を得ることは重要であります.そのためには,1つは,たとえば,統計学が必要と思いますが,しかし,日本では昔から(現在でも)統計の専門家が米国等と比較して極めて少ない状況です.そのため日本ではデータサイエンス教育が遅れ,皆さまご存じのように最近は急にデータサイエンス教育に力が入れ始められました.
近年,通信機器の発達,ネットサービスの普及,情報技術などが急速に発展し,あらゆる分野(たとえば,医療・福祉分野,食品分野,コンビニ業界,物流分野,農業分野,観光,スポーツ,行政,保健,教育など)に大量のデータが日々蓄積されています.その膨大なデータから各分野・業界にとって有用な情報を引き出す必要があります.そのためには,データを分析または解析する必要があり,数理(数学),統計学,情報学,機械学習・AI(人工知能),計算機科学などの対象分野の専門的知識が必要です.
今日,そしてこれからの社会において各分野・業界に従事している方だけでは,データを分析または解析して各分野・業界で抱えている課題を解決するための有用な情報を引き出すことが困難な場合があります.そのため,今すぐにもこの問題を解決する必要に迫られており,種々の分野・業界のデータを分析または解析できる専門的能力が求められています.種々の分野のデータの分析や解析に必要な科学(数理(数学),統計学,情報学,機械学習・AI,計算機科学など)は「データサイエンス」や「データ科学」と呼ばれています(なお,どこに重点を置くか(理論面や応用面等),また,どこまでの分野を指すか等,微妙な違いはあるかと思います).
Q2
大学におけるデータサイエンス学部の歴史を教えて下さい. いつ頃から設置されたのですか?
A2
日本において,初の「データサイエンス学部」が2017年4月に滋賀大学に新設され,統計学を専門とする元東京大学の竹村彰通教授(元日本統計学会会長)が初代学部長に就任されました(竹村先生は現在は滋賀大学の学長です).また首都圏初のデータサイエンス学部が2018年4月に横浜市立大学に新設されました,私立大学では,武蔵野大学に2019年4月にデータサイエンス学部が新設され,立正大学には2021年4月にデータサイエンス学部が新設されています.
また,データサイエンス分野を専門に学ぶ学部がいくつかの大学に設置されました.たとえば,2018年4月に広島大学に「情報科学部」が新設されました.2020年4月には長崎大学に「情報データ科学部」が新設されました,
さらに,2023年4月には女子大学では初の「データサイエンス学部」が京都女子大学に新設されました.また,同じく2023年4月に 明星大学 に日本初の「データサイエンス学環」が創設されました.データサイエンス学部は1つの学部ですが,「データサイエンス学環」は複数の学部と連携・協力してして専門科目を設けており,学部と呼ばずに「学環」と呼ばれています.
他にも「データサイエンス学部」,「〇〇データサイエンス学部」や「〇〇データサイエンス学科」,「データサイエンスコース」など,また,「データ科学」,「情報科学」などの学部や学科,またはコースなどが多くの大学に設置され始めています(詳細は省略します).
Q3
データサイエンティストとは何ですか?
A3
たとえば,医療分野において,新薬開発や新治療の開発において,臨床比較試験が行われ,統計学によるデータ分析に基づき新薬の有効性を証明することが必須であります.医療分野において医者,看護師,薬剤師,関連分野の多くの方々に,さらに高度な統計知識を持った臨床統計家(生物統計家や医療統計家ともいう)も加わって臨床試験を組み,統計的データ解析を行い,新薬の有効性などを科学的に結論付けて厚生労働省へ新薬申請することが行われています.このように医療分野のチームには高度な医療統計データの分析や解析ができる人も加わって,一緒に課題を解決しています.
他の分野・業界(食品分野,コンビニ業界,物流分野,農業分野,スポーツ,行政,教育などあらゆる分野)においても,昨今では,各分野で日々膨大なデータが蓄積されています.しかし,その分野・業界に携わっている方だけでは,膨大なデータを分析または解析して,その分野にとって有用な情報を引き出し,課題を解決することは困難な場合があります.そのような課題を解決するために「橋渡し支援をする人」が必要です.つまり種々のデータの分析や解析ができて,かつ各分野・業界の課題を解決できる解を提案できる総合的な能力を持った人が必要です.そのような能力を持った人は「データサイエンティスト」と呼ばれています.
たとえば,上述の臨床統計家(生物統計家)は、医師などの専門家と協力しながら,医療現場でかかえる重要課題に取り組むプロフェッショナルであり,医療現場におけるデータサイエンティストであります.
各分野・業界において,データサイエンティストは,データサイエンスの高い能力・学力を持っていることに加えて,各分野・業界の課題が何なのかを理解して整理し,データの分析や解析を行い,その分野に有用な情報を見つけ出し,課題をどのように解決すれば良いのかの提案もできる幅広い能力が必要です.データを分析することにより,たとえば,食品業界・小売業界などにおいて,ある商品の売り上げ予測をしたり,また商品Aに関心ある人は,どのような別の商品Bにも関心があるのかなどのデータの分析や解析の能力も必要かと思います.
これからの人間がより住みやすい未来社会(Society 5.0)の実現へ向けてのデータサイエンスが注目される昨今,種々の分野・業界においてデータサイエンティストの役割が重要です.
現在,日本では数万人のデータサイエンティストが不足していると言われており,この先も毎年データサイエンティストの求人数は増え続ける傾向にあるようです.そのため日本の大学において,「データサイエンス」 や 「データ科学」 などの名が付く学部,学科,学環,コースなどは今や大変注目されています.
Q4
「信頼される」優秀なデータサイエンティストやデータサイエンスの専門家になるためには,重要なのは何ですか?
A4
たとえば,職場において,多くのデータ分析手法の中から,あるAという分析法を用いて,その結果報告や提案等(たとえば,将来の収入予測等)を担当者にしたとき,その理由を聞かれたり,何か質問されたとき,その分析手法の妥当性やその方法の説明,そして使用した科学的(数理的)根拠などを,自信を持って答える必要があるかと思います.もし担当者が理系出身の方でしたら,そのデータサイエンティストに数理的な質問もするかと思います.その場合,「私には数理的な詳細はわかりません」では,正しく分析できても,「信頼される」優秀なデータサイエンティストといえないかもしれません.
単に優秀だけではなく,「信頼される」優秀なデータサイエンティストやデータサイエンスの専門家を目指すためには,浅く広く学ぶことだけでなく,専門的に基礎と応用を深く身につけることが重要かと思います.
現代は,理系・文系関係なくあらゆる企業,そしてあらゆる分野で「数学・統計・情報系」の 「数理」 の知識を持った人材は必要であります.そのためには,基礎は「数理面」の知識をしっかりと身につけることが大変に重要です.立派な家を建てるには家の土台をしっかりと作ることが重要です.それと同様かと思います.
大学4年間は,時間が自由にたっぷりとあります.だからこそ,人生でこの4年間でしか学べないことを重視する必要があります.つまり,深い基礎教育(家の土台部分)が最も重要です.卒業してからでは,学生時代のような十分な時間も無く,頭も固くなり,卒業後に基礎的な「数理」の知識を十分に身につけることはほぼ不可能と思います.逆に応用面は卒業してからでも身につく可能性はあります.もちろん応用面を在学中に身につけることは大切でありますが,応用面を十分理解するためには,基礎的な能力が必要であります.
大学では,専門的に基礎と応用を深く身につけること,特に「数理面」を重視した「基礎」をしっかりと学び身につけることが,「信頼される」優秀なデータサイエンティストやデータサイエンスの専門家として活躍するために大変重要であると思います.
戻る |