発表資料 | スライド資料 (pdf) |
時間 | 90分 x 2 |
講演者 | 櫻井 保志、松原 靖子(大阪大学) |
概要 | データ駆動型社会では、IoT技術により様々なセンサー、端末からビッグデータを収集し、増え続けるビッグデータを高速に学習、解析するAI技術がビジネスの成否を左右する大きな鍵となる。 本チュートリアルでは、時系列解析の基礎について概説するとともに、時系列ビッグデータを高速に学習し、予測、要因分析、トラブル予知、行動最適化のための情報提供をリアルタイムに行う最新の時系列解析技術について述べる。 その中でも特に3種類の要素技術、(1)リアルタイム予測と動的要因分析、(2)リアルタイム時系列テンソル解析、(3)リアルタイム特徴自動抽出、について概説する。 また、実際の工場の生産ライン支援や自動車運行管理など、製造業DXに関連する取り組みを実例とともに紹介する。 |
前提知識 | 不要 |
チュートリアル論文 | 機械学習回帰における Shapley 値の理論説明と事例紹介 (pdf) |
時間 | 90分 |
講演者 | 白田 由香利(学習院大学) |
概要 | 機械学習の回帰分析においてLundbergのSHAPとそのライブラリは広く活用されており、回帰分析の解析の意味解釈に多大な貢献をしている。 本チュートリアルでは、SHAPの元の理論となったShapleyの公式を、グラフィクス教材を使ってビジュアルに説明する。 N個の説明変数にそのサンプルデータのもつターゲット値を平等に分配する方法を理論的に示しShapleyはノーベル経済学賞を受賞した。 それほどShapleyの公式は画期的であり、データ工学の分野でも有益なツールとなる。 発表者は既にShapley値に関するオンデマンド教材を多数WEB上で公開しているので、参加者はそれを持参してきて頂きたい。 レクチャ当日はXGBOOSTによる結果として求められた回帰モデルの3次元グラフィクスも用いて、SHAP値を分かり易く説明する。 |
聴衆レベル | 大学院1年レベル |
動画(YouTube) |
発表資料 | スライド資料 (pdf) |
時間 | 90分 |
講演者 | 川島 英之(慶應義塾大学) |
概要 | 近年、多数のトランザクション処理技法が提案されている。 本講演ではそれらの中核であるSiloプロトコルについて解説を行う。 講演は前半と後半に分けられる。 前半ではSiloの並行性制御法について述べる。 これはKung-Robinsonの楽観法におけるクリティカルセクションを2PL同様にdecentralizeし、read lockの代わりにvalidationを実行することで2PLよりもcontentionひいてはcache missを低減させる。 時間があれば楽観法に基づくphantom avoidanceについても解説する。 後半ではSSD/NVRAMを前提とするSiloの並列ロギング法について述べる。 Epoch方式によりカウンタアクセスを緩和させることで、P-WALあるいはpassive group commitに対して性能が有利になることを述べる。 最後に、Silo以降のプロトコルを概説し、最近の潮流について述べる。 |
前提知識 | 2 phase locking、redo recovery、初等的な英語 |
発表資料 | チュートリアル論文(pdf)、 スライド資料 (pdf) |
時間 | 90分 |
講演者 | 齋藤 和広,別府 翔平,成定 真太郎,伊神 皓生,黒川 茂莉(KDDI総合研究所),山城 悠(Jij) |
概要 | ムーアの法則の限界から従来のコンピュータの成長限界が見え始め,次世代のコンピュータの候補の一つとして量子コンピュータが注目されている. 量子コンピュータは,量子力学的な現象によって0と1の得られる確率で状態を表現する「量子ビット」を利用し,複数の情報を重ね合わせて同時並列的に計算を行う. 量子コンピュータの利用者は,この量子ビットの特性を有効活用した量子アルゴリズムを設計することで,大規模な計算を高速に解くことができる. 化学や金融の領域ではシミュレーションなどの大規模な計算において活用が検討されており,データ工学の領域においても,量子コンピュータの活用によるさらなる発展が期待できる. 本チュートリアルでは,量子コンピューティングに関する基礎技術から始まり,データ工学に関連する量子アルゴリズムとして,量子機械学習手法,組合せ最適化問題の解法(量子アニーリング含む),及びデータ探索手法を紹介する. |
聴衆レベル | 学部生から社会人まで,量子コンピューティングに関する知識がない人向け |
前提知識 | 高校数学(ベクトル・行列計算,複素数),Pythonによるプログラミング |
動画(YouTube) |
発表資料 | チュートリアル論文 (pdf)、 スライド資料(外部サイト) |
時間 | 90分 |
講演者 | 髙橋 翼,リュウ センペイ,長谷川 聡 (LINE) |
概要 | 差分プライバシーは、グローバルプラットフォーマーや米国の国勢調査等における大規模な統計調査に利用される等、近年注目のプライバシー基準である。 差分プライバシーの保証には所定のノイズの加算を用いる。 そのため、ノイズの大きさによるプライバシーと有用性のトレードオフの関係がある。 一方、差分プライバシーの注目すべき点として、対象とする データやユーザ群のスケールに応じて有用性の棄損を低減できる点がある。 よって、ビッグデータを扱う研究や事業においてはプライバシーと有用性の両立が期待できることから、 差分プライバシーに関する研究は近年大きな進展を見せている。 特に、データ合成や転移学習、連合学習といったアプリケーションでは、機微データの実用的な活用を目指した研究開発が加速している。 本チュートリアルでは、差分プライバシーの浸透を目的として、初学者向けに配慮した基礎概念の解説、データ合成や転移学習、連合学習といった差分プライバシーの応用事例の紹介を実施する。 |
聴衆レベル | 学部4年生レベル |
時間 | 90分 |
講演者 | 吉川 友也(千葉工業大学) |
概要 | AIの透明性確保のためには、コア技術である機械学習の振る舞いをユーザや開発者が理解しやすい状態にすることが重要です。 本チュートリアルでは、機械学習の予測における特徴量の貢献度合いを説明できるFeature Attribution法を紹介します。 特に、Feature Attribution法の代表例であるLIMEやSHAPについて定式化から説明するとともに、Pythonを用いた実装例についても示します。 その上で、Feature Attribution法に関連する最近の研究についても紹介します。 本チュートリアルを通じて、聴講者がLIMEやSHAPの仕組みや問題点を理解した上で、実際に利用できるようになることを目指します。 |
聴衆レベル | 大学院1年レベル |
前提知識 | 線形回帰、ニューラルネット (多層パーセプトロン) |
発表資料 | 転移学習 ~様々なデータに適応するための機械学習の方法論~ (pdf)、 スライド資料 (pdf) |
時間 | 90分 |
講演者 | 松井 孝太(名古屋大学)Zhi Li(大阪大学)米川 慧,黒川 茂莉(KDDI総合研究所) |
概要 | 学習済みモデルを学習時とは異なるデータ・タスクに適応させるための機械学習の方法論である転移学習は、学習済みモデルを有効利用し、様々なデータに適応するための技術として注目を集めている。 本チュートリアルでは、基本的な問題設定と定式化からはじめ、具体的なイメージを持てるよう、手法を実際のコード例を交えながら紹介する。 まず基本的な問題設定として、データの定義域は同じだが分布は異なる場合である同種/同質的転移学習について、前提、定式化、理論を説明した後、重要度重み付き学習、ドメイン敵対的学習などの具体的な手法をコード例とともに説明する。 さらに発展として、データの定義域も異なる異種/異質的転移学習の手法についても説明する。 |
聴衆レベル | 機械学習や深層学習について、授業を受けた、あるいは、研究でプログラム/コードに触れたことがある学生(社会人も可) |
動画(YouTube) |