2021年12月15日水曜日

CBI学会2021年大会のセミナー実施結果報告です:想定よりも多くの方々に参加いただきました。

 株式会社インシリコデータの湯田が主査を務めますCBI学会の「計算毒性学研究会」が企画・主催致しました化学データサイエンスおよび人工知能関連講習会の結果報告です。開催されたのは、大会前日に半日にわたって実施されたチュートリアル(TS-02)と、大会最終日に実施されたフォーカストセッション(FS-08)です。

 TS-02のチュートリアルは、思い切ったタイトルで「半日で知る、化学分野のデータサイエンスおよび人工知能概要としました学会らしくないタイトルなので参加者が集まるか心配だったのですが、予想を超える約50名の方々に参加いただきました。なお、このチュートリアルは、計算毒性学研究会内部に設立されます「化学データサイエンスおよび人工知能討論、勉強会」への協賛企画となっております。
 タイトルの内容的に初心者の方々が集まると思いましたので、参加者はもっと少ないかと予想していたのですが、嬉しい誤算となりました。同時に化学分野へのデータサイエンスやAI適用に興味を持つ方々が多いということに、嬉しく、同時に今後の展開に力を尽くすべきと励まされました。

 FS-08のフォーカストセッションは、”「化学データサイエンスおよび人工知能討論、勉強会」立ち上げ会”のタイトルで実施されました。CBI学会としては「データサイエンスやAI」を標榜する最初のグループとなります。どの程度の方々の参加があるのか不安でしたが、当日は我々の予想を超えた約150名という多くの方々の参加があり、化学分野のデータサイエンスやAIに対する関心の高さが証明された形となりました。

 本ブログのメインタイトルは「人工知能による創薬、毒性評価」となっております。これらの研究業務は基本的に化合物を中心に展開されるもので、この意味で”化学”データサイエンスおよび人工知能となります。化学の分野への人工知能やデータサイエンスの適用は、歴史的に新しいものではなく、長期にわたり展開されてきたものです。現在のデータサイエンスや人工知能は営々と築かれてきた、化学分野の適用研究の基礎の上に展開されます。この意味で、化学のアナログ情報とコンピュータのデジタル情報との連携や融合の基本を理解しながら、最新のデータサイエンスや人工知能を適用することが極めて重要です。

 なお、TS-02の講義にて用いられた資料は「計算毒性学研究会」のホームページにアップされておりますので、興味ある方々はご参照ください。




2021年9月17日金曜日

⁂化学データサイエンスおよび人工知能関連講演会および教育講演のお知らせ

 CBI学会2021年大会では、計算毒性学関連講演会として、現在急速に展開されている化学データサイエンスおよび人工知能に関するフォーカストセッションとチュートリアル(教育)が開催されます。化学関連研究にデータサイエンスや人工知能の適用を考えている研究者の方々は奮って参加ください。


TS-02: チュートリアル 2021 年 10 月 25 日 13:00-17:00 
「半日で知る、化学分野のデータサイエンスおよび人工知能概要」: 
 「FS-08:化学データサイエンスおよび人工知能討論、勉強会」立ち上げ会協賛
 A Half-day Overview of Data Science and Artificial Intelligence in the Field of Chemistry: "FS-08: Chemical Data Science and Artificial Intelligence Discussion, Work Shop" Kick-off Meeting Sponsorship


FS-08:日時: フォーカストセッション 2021 年 10 月 28 日 13:00-14:30 
 「化学データサイエンスおよび人工知能討論、勉強会」立ち上げ会: 計算毒性学研究会主催
 "Chemical Data Science and Artificial Intelligence Discussion, Work Shop" Kick-off Meeting : Organized by the Computational Toxicology Study Group 



2021年1月4日月曜日

データサイエンスや人工知能におけるサンプルデータ: サンプル数とサンプルポピュレーション

 現在、データサイエンスや人工知能に関する研究では手法に関する研究が盛んである。

 しかし、データサイエンスや人工知能を用いて実際に適用しようとすると、機械学習に用いたサンプルデータの数や、ポジ/ネガ等のサンプルポピュレーションの問題が、最終的な解析結果の良否に大きく関係することがわかる。

 全く同じサンプルデータを用いた場合、解析手法や人工知能手法の改良や新規開発を行っても、ほとんどの場合大きな改善は見られない。大きなブレークスルーはデータ解析手法から人工知能に変換した場合等の、次元や発想の異なるレベルの手法的変化が必要である。

 同じデータ解析手法や人工知能の範囲での変化ではブレークスルーを導くような改善は期待できないと考えるべきである。

 一方で、機械学習に用いるサンプルデータに関する研究は手法と比較すると殆ど進歩していない。しかし、機械学習を適用するデータ解析や人工知能は手法を問わずすべてサンプルデータの良否が学習成果を大きく変化させることは明白である。

 即ち、標準的なデータ解析手法や人工知能手法を用いても、データサンプルを吟味した結果の方がより大きなブレークスルーを得やすいことである。これは、データ解析や人工知能をより正確で信頼性の高い状態で実施することが求められる現場においては極めて重要なポイントである。

2021年1月2日土曜日

2021年が素晴らしい年となるように願っております:The 2021 will be a wonderful and great year.

  昨年はコロナに翻弄され、日常生活を取り戻せませんでしたが、今年は通常の生活を取り戻せるようになることを願っております。


 2017年の正月に本ブログにて新年の挨拶をアップしましたが、いつの間にか4年も経ちました。この間データサイエンスや人工知能(AI)の展開は急速に進みました。研究の世界や日常生活においても、このデータサイエンスや人工知能の果たす役割や、研究対象としての存在は意識することが無く、むしろ自然に導入されているというような状況となってきました。

 4年前の本ブログを見て、データサンプルという観点から見ると現時点でほとんど変化していないことを強く感じます。データサイエンスや人工知能の開発や適用、信頼性確保という観点で最も重要なサンプルに関する議論や環境の整備が全く進んでいないことに驚きを感じました。

 従いまして今年は、データサイエンスや人工知能におけるサンプルデータの問題を主たるテーマとして討論してゆこうと考えております。

 今年もよろしくお願いいたします。

<p><b><span style="color: blue; font-size: x-large;">新たなブログ名称および内容の案です:<br>This is a proposal for a new blog name and content.</span></b></p>

   新ブログを構成するにあたり以下の点を留意しつつ検討いたしました。 ■討論テーマは来るべき「情報時代」に相応しい内容とする ・新たな技術等に関する積極的な討論を目指す。 ・「情報時代」の基盤技術となる大規模言語モデルや種々生成AIを主たるテーマとする。 ■従来型の基本的な分野...