CAUA

CTC
ACADEMIA &
USERS
ASSOCIATION

イベントレポート

AI時代を切り拓くデータサイエンティストを育てる ~国立・公立・私立、先行する大学の取組を参考に考える~

イベント会場の様子

政府の掲げる「人間中心の社会」「Society5.0」の基盤となるAI戦略の下、2040年に求められる人材について「数理・データサイエンス等の基礎的な素養を持ち、正しく大量のデータを扱い、新たな価値を創造する能力が必要」とし、数理・データサイエンス・AI教育を全ての大学生・高等専門学校生が受けられる環境を整備するという文部科学省の宣言から、多くの大学が教員の確保、体制整備に奔走しています。
2016年に拠点校として6つの大学が指定され、2019年には協力校として20大学が選定されました。これらはいずれも国立大学ですが、全国の公立・私立大学も文系学生を含む複数の分野に対応した実践的教育モデルを試行錯誤しています。
今回のCAUAシンポジウムでは、一早く開始した国立、公立、私立の各大学における学生教育の実態について、様々な背景を持つ先生方と情報を共有するとともに、2040年の未来に向けたアプローチを考えます。

開催日
2019年11月18日(月)
13:30~17:30
(情報交換会 17:45~19:15)
会 場
Innovation Space DEJIMA
主 催
CAUA

プログラムをダウンロード

講演内容

はじめに

深澤 良彰 氏
(早稲田大学 図書館長 理工学術院 教授、CAUA会長)

深澤 良彰 氏(早稲田大学 図書館長 理工学術院 教授、CAUA会長)

深澤 良彰 氏
(早稲田大学 図書館長 理工学術院 教授、CAUA会長)

今回のシンポジウムのテーマは「AI時代を切り拓くデータサイエンティストを育てる ~国立・公立・私立、先行する大学の取組を参考に考える~」です。データサイエンスは動きが激しい分野です。文部科学省は、2040年に求められる人材について「数理・データサイエンス等の基礎的な素養を持ち、正しく大量のデータを扱い、新たな価値を創造する能力が必要」とし、「数理・データサイエンス・AI教育を全ての大学生・高等専門学校生が受けられる環境を整備する」と宣言しました。2016年に「数理及びデータサイエンスに係る教育強化」の拠点校として6つの大学が指定され、2019年には協力校として20大学が選定されました。これらの国立大学だけでなく、全国の公立・私立大学も文系学生を含む複数の分野に対応した実践的教育モデルを試行錯誤しています。学会レベルでも情報処理学会の部会やデータサイエンティスト協会の活動が活発化しています。

こうした動きを単なる流行に終わらせることなく、地に足をつけた取り組みで成果をきちんと出さなければなりません。データサイエンスの素養を持つ学生が育ち、企業に入る。あるいは、企業のリカレント教育でデータサイエンスを学んで、仕事に役立てる。このようなサイクルがうまく回らないと、今後の日本がデータサイエンスにおいて強みを発揮することはできません。今回のシンポジウムでは、データサイエンス教育をいち早く開始した国立、公立、私立の各大学におけるキーマンの方々に学生教育の実態について語っていただき、2040年の未来に向けたアプローチを考えます。

基調講演

「滋賀大学データサイエンス学部の過去、現在、
そして未来を語る」

齋藤 邦彦 氏
(滋賀大学 データサイエンス学部 教授)

講演資料をダウンロード

齋藤 邦彦 氏(滋賀大学 データサイエンス学部 教授)

齋藤 邦彦 氏
(滋賀大学 データサイエンス学部 教授)

滋賀大学は、データサイエンス教育のモデルとなることを目標として、2017年に日本初のデータサイエンス学部を設置しました。情報技術と統計知識を併せ持つデータサイエンティストを育成するために、実データを用いた問題解決の経験を積み重ねることを重視した教育を行っています。カリキュラムは海外の最先端大学を参考に作りました。当時の日本の大学には統計学部・学科がありませんでしたが、アメリカやイギリスをはじめ、アジアにおいても韓国や中国の多くの大学に設置されていました。また、世界ではデータサイエンスやAI、IoTなどが急激に話題に上ってきました。本学ではこうした世界的な動きを背景にデータサイエンス学部を新設し、さらに今年は大学院もスタートしました。

データサイエンス学部の設置にあたり、データサイエンス教育のモデルを定義しました。すなわち、データアナリシスとデータエンジニアリングの学習で得た新しい知見による価値創造です。大規模データを分析・解析するための専門的知識とスキルは、統計学を中心とするデータアナリシス系科目で学び、大規模データを加工・処理するための専門的知識とスキルは、情報工学・コンピュータ科学を中心とするデータエンジニアリング系科目で学ぶ。そして、ビジネスや政策などの領域で課題を読み取り、データアナリシスとデータエンジニアリングによる知見を現場の意思決定に生かして、価値を創造する。こうしたモデルを土台にした文理融合型の緻密なカリキュラムを通して、実力のあるデータサイエンティストを育成していきたいと考えています。

本学のカリキュラムの真骨頂は、実際のデータを用いたPBL(問題解決型学習)系の科目で、初年次から始まります。企業、自治体、非営利団体等の現場のデータを使って、外部に開かれた実践の場でのコミュニケーション力やチームワーク形成力を鍛錬していきます。1年生は入門演習、2年生はフィールドワーク演習、そして3・4年生はゼミにあたる実践価値創造演習に取り組みます。例えば、ある期間の特定の店舗の売り上げデータを使った集計と非負値テンソル因子分解という手法を用いて、来店頻度分析と買い物パターンの特徴抽出を行い、地域のスーパーの売り上げ分析を行ったゼミや、お菓子の売り上げデータから購入意欲を上げるために商品分析を行い、売り上げ向上のための施策を提案・検証を行ったゼミがあります。データコンペティションへの参加も演習の一環として積極的に取り組んでいます。

本学が設定した期待される学生成長モデルは3つあります。1つ目は、様々な領域に精通し、データ分析の結果に基づく新たなアイディアの創出を得意とするデータサイエンティスト型。2つ目は、情報系科目を中心に履修し、データ収集・処理・管理に長けるデータエンジニア型。3つ目は、統計系科目を中心に履修し、各種統計手法を理解し、データに応じた適切な手法の選択、新たな手法の開発ができるデータアナリスト型。こうした人材を育成して社会に送り込むことを目指しています。

今後のデータサイエンス教育を考えるにあたっては、まずは文理融合型教育の展開によって、英語、プログラミングは高校までに習熟し、数学に苦しむ学生も減ってほしい。そして、近い将来のデータサイエンティストは、統計と情報とビジネスのバランスが取れた人材であり、ある分野に特に優れた逆T型人材や逆π(パイ)型人材であってほしい。こうした人材を育成するために、2020年代には多くの大学でデータサイエンス、数理情報、AIを教育する学部が設置されることになるでしょう。

今のところ、新しいデータサイエンス系の学部は情報系学部からの転換が多くみられますが、これからはビジネス系や人文社会系学部からの再編が必要です。経済学部や経営学部、社会学部などでもデータサイエンスを使う教育が行われるようになってほしいと思います。滋賀大学では、これからの10年を大きな転換の時代ととらえ、そうした時代に対応できる人材育成教育を進めていきたいと考えています。

特別講演

「横浜市立大学のデータサイエンス教育
---WiDS Tokyo@YCUを通じて」

小野 陽子 氏
(横浜市立大学 データサイエンス学部 准教授、
Women in Data Science (WiDS) Ambassador)

講演資料をダウンロード

小野 陽子 氏(横浜市立大学 データサイエンス学部 准教授、Women in Data Science (WiDS) Ambassador)

小野 陽子 氏
(横浜市立大学 データサイエンス学部 准教授、
Women in Data Science (WiDS) Ambassador)

データサイエンスの歴史をひも解くと、1960年代から80年代にかけては統計学者や計算機科学者がリードし、90年代には学会レベルへと発展しました。2000年代に入るとビジネスの世界で注目を集めるようになり、2010年代で一般社会にまで認知が広がってきました。データサイエンスへの期待が高まる中で、大学関係者はデータサイエンス教育にどのように取り組むべきなのでしょうか。

米国ストーニーブルック大学のSteven Skiena教授が「The Data Science Design Manual」で示したように、データサイエンスは統計学と計算機科学の単なる融合分野ではなく、そのゴールは実質的なドメインへの適用です。学生が学んだことを社会における様々な領域の具体的な問題解決に生かすことが求められます。統計学と計算機科学がデータサイエンスに欠かせない力であることは間違いありませんが、その力で社会の期待をどれだけ満たせるかが要求されます。こうした評価基準を意識しながらデータサイエンス教育に取り組むべきだと考えています。

横浜市立大学のデータサイエンス学部では、ドメインへの興味喚起とドメインでの学びを重視した教育プログラムを組んでいます。もちろん、線形代数をはじめとする基礎教育および統計、アルゴリズム、計算機科学という柱となる学問の融合領域はしっかり学びます。その上で学生には、学んだことをどんな分野で生かすのかということを意識して、いろいろな分野に興味を持って取り組んでもらいたいので、他学部にも出向いて広く浅くたくさんのことを学び、引き出しをたくさん作ってほしいと伝えています。

ドメインでの学びについては、大学の外でのプログラムが主体です。データサイエンスのプロセスは、課題を見つけ、データの定義、収集、加工、分析を行い、解釈・提案し、提案完了という流れです。このうちデータを扱う部分については主に学内で学び、課題発見や解釈・提案は学外で学びます。本学では3年生でPBL(問題解決型学習)が始まります。協力企業や自治体に学生がチームで出向いて、課題を発見するところからスタートし、様々な解析を実行し、最終的な提案までを2~3週間で行います。また、文部科学省の超スマート社会の実現に向けたデータサイエンティスト育成事業に採択されたYOKOHAMA D-STEPというプログラムも用意しており、文理融合、実課題解決型データサイエンティスト育成を目指して、産官学連携で修士レベル相当の教育を行っています。このPBLは本日の会場であるInnovation Space DEJIMAをお借りして実施しています。

Women in Data Science(WiDS)への参画は、本学のデータサイエンスに対する特徴的な取り組みです。WiDSでは2019年には50か国以上、150以上の都市でイベントが行われ、日本と韓国では初めて開催されました。WiDSは女性限定のイベントではありません。所属割合が少ない女性をデータサイエンスの分野に誘って発展させ、継続させることが目的です。オールラウンド型のデータサイエンティストを育てるのではなく、周囲の人々が暮らしていく上でより良い環境を構築するために活躍できるようなデータサイエンティストチームの育成を目指しています。

本学が本年3月22日に開催したWiDS Tokyoでは、シンポジウムの来場者の6割ほどが女性で、個別発表は産業界から2人、大学から1人の計3名の女性にお話しいただきました。同時に「新しい働き方」というテーマでアイディア・チャレンジも行いました。難しいデータ解析ではなく、SDGs(持続可能な開発目標)を基調としたアイディアをデータから語ろうと、学生の部と一般の部でコンペティションを開催しました。次回のシンポジウムは2020年3月18日に開催が決定しています。テーマは「すこやかに働く」で、アイディア・チャレンジも開催します。

データサイエンスが社会にどれだけ幸せをもたらすことができるかという観点で考えると、この分野が学生起業するような一部の先鋭的な人たちだけで進めるものと思われてはなりません。多種多様なバックグラウンドを持った方々に参加してもらわないと、地方の問題をはじめとする日本特有の問題や世界のSDGsの問題などにはとても対応できません。尖った学生ももちろん必要です。しかし、自分の問題として引き出しを多く持って、その引き出しに的確にアクセスできる、そして様々なドメインに対してパッションを持ってデータサイエンスに取り組める、そのような学生を育成していきたいと考えています。

テーマトーク①

「青山学院大学理工学研究科における
データサイエンティスト育成プログラム」

大原 剛三 氏
(青山学院大学 理工学部 教授)

講演資料をダウンロード

大原 剛三 氏(青山学院大学 理工学部 教授)

大原 剛三 氏
(青山学院大学 理工学部 教授)

青山学院大学のデータサイエンティスト育成プログラムは、理工学研究科博士前期課程の全コースの学生が履修可能な横断的なプログラムとして、2019年度からスタートしました。データサイエンスに関する実践的な知識と技術の養成を目指し、座学や実践演習ともに企業などと連携・協力した実施を重視しています。1年間で所定の単位を取得することで修了証明書を発行します。

本プログラムでは3つの能力の開発を目標としています。1つ目はデータを読み解く洞察力。2つ目は先端的技術を実践できる応用力。そして3つ目は結果の妥当性を判断できる評価能力。これらの能力を学生に身につけてもらうために、実際のカリキュラムでは、土台となる知識と技術を身につける講義科目とスキル演習科目を主に前期および夏期集中期間に、そして講義と演習で得た知識と技術をベースに学外インターンシップもしくは学内PBLに参加して学ぶ課題解決型科目を後期に配置しています。

例えば、知識に関する科目の必須科目である先端データ分析特論は、企業などのデータサイエンス実務者によるオムニバス講義です。データ分析・活用による問題解決事例や実務上の課題など、実際の経験に基づいた内容になっています。技術に関する科目は選択科目としていくつか用意していますが、統計的データ分析基礎演習では、多変量解析を中心とした統計的なデータ分析手法の基礎理論の学習と演習を行います。使用言語はRもしくはExcelで、相関分析や単回帰分析、主成分分析、クラスター分析などを学びます。機械学習アルゴリズム応用演習では、Pythonを使った基本的な機械学習アルゴリズムの基礎理論の学習と演習を通して、実データに適用するスキルの習得を目指します。例えば、Pythonの代表的な機械学習ライブラリであるscikit-learnを使って、ベンチマークデータなどを実際に適用した一連のプロセスを経験します。

その上で、学外インターンシップもしくは学内PBLという形で実践的な課題解決型演習を行います。学外インターンシップでは、連携機関として企業に学生を受け入れていただき、企業が設定した分析課題に取り組む予定です。学内PBLは、連携機関から提供された実データもしくはオープンデータを対象に、実際のニーズを前提とした分析課題に取り組むことになっています。

今年度は、先端データ分析特論の講義には、企業や研究機関など計13連携機関にサポートをいただき、また課題解決型演習も9連携機関の協力が得られ、いいスタートが切れました。一方で、課題もあります。学生の予備知識と個人の理解度の個人差をどう吸収するか。教育側の負担をどう軽減するか。既存科目との配置の競合をどう解消するか。こうした問題を解決しなければなりません。今後は、社会人教育をどうするか、という課題もあります。本プログラムで経験・蓄積したことを、社会人にも積極的にフィードバックしていきたいと考えています。

テーマトーク②

「立教大学大学院人工知能科学研究科における
AI・データサイエンス教育」

内山 泰伸 氏
(立教大学 理学部 教授、
人工知能科学研究科設置準備室長)

講演資料をダウンロード

内山 泰伸 氏(立教大学 理学部 教授、人工知能科学研究科設置準備室長)

内山 泰伸 氏
(立教大学 理学部 教授、人工知能科学研究科設置準備室長)

立教大学では来年4月に人工知能科学研究科を開設しますが、立教大学のためだけに作ったわけではありません。様々な方面の方々と協力しながら発展させたいと考えています。

新しい研究科には4つの大きな特徴があります。第1に機械学習・深層学習の本格的な学習です。研究も大事ですが、教育面を重視しています。第2にリベラルアーツとAI・データサイエンスの掛け算。文学部や経済学部、社会学部など様々な学部と協力しながら、AIとデータサイエンスの応用を進めていきます。第3は産学協力して新しいエコシステムを作るということ。そして、第4は社会人の入学を歓迎するということ。授業は平日の午後6時55分からの6限と土曜日で、場所も池袋ということで社会人にも通いやすい立地です。

本研究科のミッションは、人工知能とデータサイエンスのパワーを社会の様々な課題解決に使うということです。基礎科学としての人工知能およびデータサイエンスと、社会のビジネスあるいは日本の社会全体を超スマートな社会にしていくというソサエティ5.0。これらを結びつけるだけでなく、新しいシステムを作りたいと考えています。

人工知能とデータサイエンスは、似ている部分もあり、違う部分もあります。人工知能は、人間の知能を代替したり、補完したり、拡張したりして、人の作業を自動化します。中心は機械学習で、データから相互関係性を吸い出して、非言語的な知識に変換する。これを様々なサービス、新しい発見、創造、意思決定といった分野に展開します。

一方、データサイエンスではデータそのものに価値を置きます。いわゆるビッグデータです。人工知能で扱うデータも大きいのですが、例えばGoogle翻訳で使う元々のデータは膨大な文章であり、単に分量が多いだけで、あくまで言語のシンプルなデータです。しかし、データサイエンスで扱うデータは非常に複雑です。宇宙望遠鏡の研究で成果を出すためには、10年も時間をかけて100人もの優秀なサイエンティストが分析します。そのくらいデータの分量が多いし、天気のデータ、天体からのデータ、望遠鏡データなど、全く種類の違う複雑なデータを扱わなければなりません。

データサイエンスはデータに重心があり、データと格闘しながら真理や知識を得ていく。ここで得た真理や知識は、言語化もしくはアルゴリズム化で明示できるので、その後は別の人が価値創出に使うことが可能です。人工知能の場合は、全体として一連の作業になるので、シームレスにやらないといけない。ここが人工知能とデータサイエンスの根本的な違いだと私は考えています。

冒頭でお話ししたように、今回作ったのは立教大学の研究科ですが、立教大学のために作ったわけではありません。こうした人工知能とデータサイエンスの特徴をよく理解して、社会問題の解決に役立てられる人材育成を、日本全体、ワンチームで推し進めようという強い気持ちで取り組んでいきたいと思います。

パネルディスカッション

「AI時代を切り拓くデータサイエンティストを育てる」

コーディネーター
野村 典文 氏(伊藤忠テクノソリューションズ(株)、CAUA運営委員)

パネリスト(五十音順)

  • 内山 泰伸 氏(立教大学 理学部 教授、人工知能科学研究科設置準備室長)
  • 大原 剛三 氏(青山学院大学 理工学部 教授)
  • 小野 陽子 氏(横浜市立大学 データサイエンス学部 准教授)
  • 齋藤 邦彦 氏(滋賀大学 データサイエンス学部 教授)
パネルディスカッション

パネルディスカッションでは、大学におけるデータサイエンス教育の課題について、様々な角度から切り込んだ討論が行われました。

前半では、大学でのデータサイエンス教育と社会におけるデータサイエンスの認知の底上げに今不足しているものは何か、という問いに対し、「上層部の理解。大学も企業も幹部の理解が進まないと日本はますます遅れていく。」(内山氏)、「共通に使えるデータの整備。短期間で優れた人材を育成するには自由に使える実データが不可欠。」(大原氏)、「感性を大事にするゆとりが足りない。実利ばかり追求すると夢がなくなり、学生の様々な可能性を摘んでしまう。」(小野氏)など様々な視点から意見が交換され、議論が盛り上がりました。

主にデータサイエンスのリテラシーレベルに関する議論が展開された後半には、その話題は大学入試の改善点にまで及び、数学に関する素養や知識の重要性があらためて確認されたほか、論理を積み上げる力を面接や論文で評価することの可能性も指摘されました。さらには、「就職活動の企業インターンのように、高校生が大学に来てゼミで勉強して交流して、それが入試の代わりになって大学に入学する、という道があってもおもしろい。」(齋藤氏)という現在の入試制度の枠を飛び越えた案も提示されました。

そのほか、大学のデータサイエンス教育における企業の協力体制や、企業の管理職のリカレント教育の重要性など、企業視点による議論も展開され、最後にパネリストの先生方が将来の夢や希望を語り、約1時間にわたるパネルディスカッションが終了しました。