概要
本イベントでは、テキストマイニングにトピックモデル、ベイジアンネットワークという
AI技術を組み合わせて、有用なビジネスアクションを探索する大規模テキストデータの新
しい分析技術について紹介します。
《第1部》
株式会社アナリティクスデザインラボ 代表取締役 の野守耕爾様より、テキストマイニン
グから大規模言語モデルに至る自然言語処理のAI技術の体系を紹介します。
《第2部》
引き続いて野守耕爾様より、テキストマイニングとトピックモデル、ベイジアンネットワ
ークとを組み合わせた新分析技術とその事例を紹介します。
《第3部》
AITeC データマイニングWGリーダー(株式会社NTTデータ数理システム) の岩本圭介より、
第2部で紹介したAI技術を統合して扱うことができる、同社開発の分析プラットフォーム
を紹介します。
プログラム詳細
15:00 開会、本イベントについてのご案内
15:05 開会のご挨拶、人工知能技術コンソーシアムのご紹介
【人工知能技術コンソーシアム 会長 本村 陽一 様】
15:15 《第1部》いまさら聞けない自然言語処理のAI技術の体系
~テキストマイニング・トピックモデル・深層学習モデル・大規模言語モデル~
【株式会社アナリティクスデザインラボ 野守 耕爾 様】
16:00 休憩
16:05 《第2部》大規模テキストデータから要因関係を発見する三位一体分析
~テキストマイニング×PLSA×ベイジアンネットワーク~
【株式会社アナリティクスデザインラボ 野守 耕爾 様】
16:50 休憩
17:00 《第3部》多様なAI技術のコラボレーションを実現する分析プラットフォームのご紹介
【株式会社NTTデータ数理システム 岩本 圭介 様】
17:20 質疑応答
17:30 閉会
各講演概要
《第1部》いまさら聞けない自然言語処理のAI技術の体系
~テキストマイニング・トピックモデル・深層学習モデル・大規模言語モデル~
ChatGPTがリリースされてまもなく2年が経過し、生成AIブームも日常化してきました。
流行や熱狂は課題の本質を見失わせてしまうので、個人的には生成AI一辺倒のアプローチ
には危うさも感じますが、皆さんは生成AIをどこまで理解して使われていますでしょうか。
生成AIは大規模言語モデルをベースにしている、その核心技術がTransformerである、
それくらいのことはよく知られています。しかし、その技術の仕組みを問われて答えられ
る人は限られるかと思います。一般ユーザが技術の理論まで熟知する必要はありませんが、
生成AIを使うからには最低限の仕組みの理解や、それを踏まえた適用性を判断できるスキ
ルは重要です。
本講演では、単語を抽出しカウントする従来の自然言語処理技術である「形態素解析」
「Bag-of-Words」「TF-IDF」から、その単語の頻度から文書のトピックを抽出するトピ
ックモデルの「LSA」「NMF」「PLSA」「LDA」、文章の変換や生成を深層学習で実現した
「word2vec」「RNN」「LSTM」「seq2seq」「Attention」、そしてそれが大規模言語モデ
ルへと進化した「Transformer」「BERT」「GPT」「T5」を取り上げ、技術の進化を辿りな
がら各手法の概要を解説します。また、同じテキストデータを処理対象とするテキストマ
イニングと大規模言語モデルの違いも対比して解説します。
《第2部》大規模テキストデータから要因関係を発見する三位一体分析
~テキストマイニング×PLSA×ベイジアンネットワーク~
テキストデータに潜む傾向を把握するテキストマイニングという分析手法は、今では様々
なツールが登場し、ビジネスの場面でもよく活用されています。テキストマイニングの実
行で文書に含まれる単語を抽出し、その単語を軸とした集計と可視化によって記述傾向の
現状を把握できます。しかし、大規模なデータでは可視化結果が複雑で解釈しにくいこと
や、現状把握を超えて変化の状態を把握するシミュレーションまでは実行できません。
本講演では、こうしたテキストマイニングの課題に対して、トピックモデルのPLSAと確率
的因果モデルのベイジアンネットワークという2つのAI技術を組み合わせて開発した「Nom
olytics」という新しい分析手法をご紹介します。PLSAで得られたトピックに基づく分析
により、大規模なテキストデータでも傾向の把握が容易となります。また、ベイジアンネ
ットワークによりテキストデータに潜む要因関係を発見し、その関連性の影響の変化をシ
ミュレーションできます。これによって影響力のある有用なビジネスアクションを探索で
きます。本講演ではこのNomolyticsの適用事例として、旅行の口コミデータを対象に観光
マーケティングを検討する分析と、特許文書データを対象に企業の技術戦略を検討する分
析をご紹介します。
《第3部》多様なAI技術のコラボレーションを実現する分析プラットフォームのご紹介
第2部でご紹介する「Nomolytics」は、AI技術を複合的に用いることが大きな特色です。
(株)NTTデータ数理システムで開発を行っている分析プラットフォーム「Alkano」では自
然言語処理とトピックモデル、ベイジアンネットワークといった技術を一つのプラットフ
ォーム上で統合して扱うことが可能です。本講演では、分析プラットフォームAlkano、そ
してその上での多様なAI技術のコラボレーションについてご紹介します。
講演者ご紹介
株式会社アナリティクスデザインラボ
代表取締役 野守 耕爾 様
《略歴》
早稲田大学大学院 創造理工学研究科 経営システム工学専攻 博士課程修了。博士(工学)。
産業技術総合研究所 デジタルヒューマン工学研究センター、
有限責任監査法人トーマツ デロイトアナリティクスを経て、
2017年6月に株式会社アナリティクスデザインラボを設立。代表取締役。
企業のデータ分析・データ活用を支援するコンサルティング事業および新しい分析技術の
研究開発を展開。人工知能学会 全国大会優秀賞、日本マーケティング学会
カンファレンスベストペーパー賞、日本人間工学会 大島正光賞(最優秀論文賞)など
受賞。専門は統計解析、人工知能、確率モデリング、テキストマイニングなど。
株式会社NTTデータ数理システム
データマイニング部 主幹研究員 岩本 圭介
《略歴》
AITeC データマイニングWG リーダー。株式会社NTTデータ数理システム にて
開発チームを率いる傍ら、お客様への分析伴走サポート業務や分析受託業務に従事。
セミナー配信方法
Webinar形式(zoom)で配信いたします。
参加用URLは参加をお申込いただいた後に、お申し込みページ内でご確認いただくことができます。
★目 的 企業・大学・研究機関の技術交流の場を提供することにより、人工知能技術に関連する情報の共通認識形成を図り、人工知能技術全般の一層の技術向上及び普及を促進することを目的に、国立研究開発法人 産業技術総合研究所(産総研)人工知能研究センターに人工知能技術コンソーシアムを設置。 ★事 業 ①人工知能に関連した技術の情報交換 ②人工知能に関連した技術の情報収集と提供 ③その他本コンソーシア...
メンバーになる