2022年6月7日火曜日

人工知能は機械学習の中でも、
ネットワークを基本とした機械学習を適用したものです。

 機械学習には多種多様な手法や技術が適用されており、機械学習を適用する多変量解析・パターン認識(MV・PR)や人工知能(AI)の手法や種類により適用される手法が異なります

 機械学習の基本的な実施目的である、最適化、最小/極小化等を行う内容や手法が異なります。 大きく、多変量解析・パターン認識で適用される機械学習法と人工知能(AI)で適用される機械学習法に二分類できます。

 人工知能(AI)で適用される機械学習は、ネットワーク(ニューラルネットワーク型)構造を基本としており、このネットワーク上での情報の流れを実施目的に合わせてコントロールできるように最適化します。 多変量解析・パターン認識上での機械学習でもネットワーク構造を扱うケースもありますが、そのネットワーク構造は人工知能(AI)で適用されるニューラルネットワーク型とは全く異なります。

 個々の機械学習の詳細な説明は別の機会に行いますが、多変量解析・パターン認識での機械学習と、人工知能(AI)で適用される機械学習は異なったものであることを理解しておいてください。 この事実を理解していれば、「機械学習を行えば人工知能(AI)を実施した」とは必ずしも言えないことがわかります。

 「機械学習をして人工知能(AI)を実施した」というためには、人工知能で用いられるネットワーク(ニューラルネットワーク型)構造を用いた機械学習(即ち、深層学習やバックプロパゲーション等)を行ったということが前提となります。



2022年5月10日火曜日

機械学習を行って人工知能(AI)を実行した、というのは正しいのか?

 「機械学習を行って人工知能(AI)を実行した」

 この事実は、機械学習においてある条件を満たした場合は正しく、その条件を満たさない時は間違っています。

 機械学習は人工知能(AI)のみならず、多変量解析・パターン認識でも適用される基本的な手法です。 従って、「機械学習を行って多変量解析・パターン認識を実施した」ということも発生します。

 機械学習は多変量解析・パターン認識および人工知能(AI)の両方で適用される基本的な手法です。 但し、機械学習には様々な手法が存在しており、実施目的(多変量解析・パターン認識および人工知能(AI))に従って適用される手法が異なります。

人工知能(AI)用の機械学習を適用 ⇒ 人工知能(AI)の適用

多変量解析・パターン認識用の機械学習を適用 ⇒ 多変量解析・パターン認識の実施

 以上のように、人工知能(AI)を実施したという場合と、多変量解析・パターン認識を実施した時とでは機械学習の手法が異なっています。 この差異については、改めて本ブログにアップ致します。

 現在、機械学習を行ったから人工知能(AI)を実施したという免罪符的な詭弁が用いられている場合が多いように感じます。 人工知能(AI)を実施するにはサンプル数が多くなければならない、要因解析が困難等の問題があり、これらの解決にはかなりの工夫が必要となり、様々な解決すべき困難を伴います。 このために、少ないサンプルや要因解析等の問題を解決可能な多変量解析・パターン認識を適用するのですが、人工知能(AI)を実施したと宣言することが必要な場合に、機械学習が免罪符として利用されます。

 「線形重回帰も機械学習を行っているから、人工知能(AI)を実施したあるいは「人工知能は機械学習を実施しているので、多変量解析・パターン認識を行ったということを主張することは間違いであることは明確ですね。 プーチン大統領が言う「我々はネオナチと戦っている」と主張するのと大きな差異はないですね。 機械学習の種類を意識しないとこのような結論に至ることになります。




2022年4月3日日曜日

機械学習深層学習の違い:
多変量解析・パターン認識とAI の学習の違いについて

  先に報告したAI-SHIPSシンポジウム(AIを用いた新たな毒性予測に向けて、AI-SHIPSプロジェクト― 事業の成果と今後の展望 ―)において、機械学習をしているのでAIであるという偏った、誤った考えを持っていることが明らかになりました。 これは、AIに対応する機械学習を実施していれば正しいのですが、多変量解析・パターン認識で展開されている機械学習と同様な手法を用いれば間違った適用をしていることになります。 AI-SHIPSに限らず、化学分野では機械学習をすればAIであると称し、実質的には一般的な多変量解析・パターン認識を実施していることが多いようです。


 この定義に従えば、機械学習をすれば総てAIであり機械学習をすればすべて多変量解析・パターン認識と言えることとなり、明らかに矛盾してきます。 この矛盾は機械学習に関する理解が不十分であるために発生すると考えます。
 機械学習をすればAIであるという自分に都合の良い/間違った主張や観点は、今後の真のAI展開において不適切なものとなりますので、本ブログにて機械学習について考察いたします。

 



2022年2月26日土曜日

AI-SHIPSシンポジウム(AIを用いた新たな毒性予測に向けて、AI-SHIPSプロジェクト― 事業の成果と今後の展望 ―):参加と討論報告:1

  AI-SHIPSシンポジウム(AIを用いた新たな毒性予測に向けて、AI-SHIPSプロジェクト― 事業の成果と今後の展望 ―)二月二十一日開催、に参加いたしました。 このAI-SHIPSシンポジウムにて、改めてAI(人工知能)とは何であるかについて考えさせられたので、現時点で改めましてAIとは何であるかについて考えてみたいと思います。

 本ブログの名称は「人工知能による創薬、安全性評価ブログ」です。 従って、本ブログの中での討論は「化合物」を中心として展開される様々な展開分野に関し、AIをどのように適用するのかという観点に関する討論を行うことを目指しております。 特に、創薬や安全性評価という研究の広い裾野と様々な関連研究分野より構成される適用分野での討論をターゲットとして討論してまいりました。

 今回の「AI-SHIPSシンポジウム」への参加/討論で強く感じたことは、AI-SHIPS は「AIを用いた・・・」というフレーズがプロジェクト名にトップで大きく掲げられています。 従ってAI に関する研究がプロジェクトの主体テーマであると感じますが、実態は従来型のWET系の実験を中心とした展開であるということです。 これが「AI-SHIPSシンポジウム」に参加した時に強く感じた違和感となります。 肝心の、「AIを用いた・・・」というところは、従来型のシステム構築で済ませているのが実態であったということです。極めて残念です。

 AIの適用に関しては、機械学習を行えばAIという観点で考え、多変量解析やパターン認識を適用することでAIを適用したと主張しております。 この観点でAIを実施したと主張されると、日本では、少なくとも化学研究分野、AIの展開や適用ノウハウ等が育たなくなります。 現在、デジタル(IT)国家を標榜する大きな流れの中で、IT技術の先端技術として急速に拡大しているAIを、中途半端な形で定義し、あいまいなものとすることは極めて憂慮されるべきことと考えます。

 化学分野でのAI実施には様々な困難が待ち受けていることは明確です。 このブログでも様々な形で問題を提起し、討論を行っています。 AI実施は難しいというのは誰もが知っていることです。 この困難性に正々堂々と立ち向かって、様々な問題にチャレンジし、突破してゆくことがIT国家には必要なことではないでしょうか。 このようなことを目指して実施するのが国家プロジェクトの責務と考えます。

□以下は参考となる項目です。

1.AI-SHIPSシンポジウムへの参加報告です。

2.チャットで行った質問内容に関する報告です。

3.「計算毒性学研究会」主査の、湯田によるシンポジウム参加の報告です。



2022年1月24日月曜日

時代が大きく変化しております:
人工知能自体も、より高度なレベル「オートノマス(自律型/化)化学」へと発展するものと考えます。

  本ブログでは化学分野における人工知能の適用を中心として展開してきました。 この化学分野へのAI適用を中心として、バイオや医療分野への適用も拡大適用のケースとして積極的に討論してまいります。また、適用理論のみならず、人工知能の研究の基本となる人工知能自体の討論も活発に実施してまいります。この流れはそのまま今後の本ブログの討論項目として展開してまいります。人工知能に興味を持ち、特に化学分野への適用を計画されている方々の積極的な意見やアドバイスをお待ちいたしますので、本年度もよろしくお願いいたします。

 現在の傾向としては、AIのみならずデータサイエンス手法と連携しながら展開されることが多く、この方が様々な状況に対応可能であり、両方の技術の相乗効果や個々の技術のレベル強化につながると考えます。

 この点で、データサイエンスやAI適用の今後の発展及び究極の形は単なる「自動化」というよりは、判断や決定を伴う「オートノマス(自律型/化)」であると考えます。定型的な作業の繰り返しで、高精度、高速化や長時間(無休)稼働といった「自動化」はデータサイエンスやAIの目標ではありますが、一つの到達点と考えます。判断や決定を伴う「オートノマス(自律型/化)」が、データサイエンスやAI適用の最終ゴールであり、この実現を目指して今後急速に技術の展開や発展が進んでゆくと考えます。

 本ブログが「化学分野でのAI適用」を標榜しておりますので、今後は目標/達成レベルを上げて「化学分野でのオートノマス(自律型/化)」を目指してまいりたく考えます。

 今回「オートノマス(自律型/化)化学」を基本テーマとし、積極的に討論/展開するブログが開設されましたので、この新規のブログとの連携を強化しつつ展開してまいる所存です。今後ともよろしくお願いいたします。

 また、データサイエンスの分野では、「ビッグデータ」時代に適したデータ解析手法である「KY法」を議論するブログも展開されておりますので、「オートノマス(自律型/化)」を議論する上でご参照いただければ幸いと存じます。



 

2022年1月1日土曜日

新年あけましておめでとうございます。
Best wishes for the New Year.

 

謹賀新年

今年もよろしくお願いいたします。


     


 化学分野への人工知能技術の本格的な展開はこれからです。化学分野の特性を生かしつつ、化学(アナログ情報)と人工知能(デジタル)の融合を目指した最新の技術展開を目指して挑戦してまいります。



2021年12月15日水曜日

CBI学会2021年大会のセミナー実施結果報告です:想定よりも多くの方々に参加いただきました。

 株式会社インシリコデータの湯田が主査を務めますCBI学会の「計算毒性学研究会」が企画・主催致しました化学データサイエンスおよび人工知能関連講習会の結果報告です。開催されたのは、大会前日に半日にわたって実施されたチュートリアル(TS-02)と、大会最終日に実施されたフォーカストセッション(FS-08)です。

 TS-02のチュートリアルは、思い切ったタイトルで「半日で知る、化学分野のデータサイエンスおよび人工知能概要としました学会らしくないタイトルなので参加者が集まるか心配だったのですが、予想を超える約50名の方々に参加いただきました。なお、このチュートリアルは、計算毒性学研究会内部に設立されます「化学データサイエンスおよび人工知能討論、勉強会」への協賛企画となっております。
 タイトルの内容的に初心者の方々が集まると思いましたので、参加者はもっと少ないかと予想していたのですが、嬉しい誤算となりました。同時に化学分野へのデータサイエンスやAI適用に興味を持つ方々が多いということに、嬉しく、同時に今後の展開に力を尽くすべきと励まされました。

 FS-08のフォーカストセッションは、”「化学データサイエンスおよび人工知能討論、勉強会」立ち上げ会”のタイトルで実施されました。CBI学会としては「データサイエンスやAI」を標榜する最初のグループとなります。どの程度の方々の参加があるのか不安でしたが、当日は我々の予想を超えた約150名という多くの方々の参加があり、化学分野のデータサイエンスやAIに対する関心の高さが証明された形となりました。

 本ブログのメインタイトルは「人工知能による創薬、毒性評価」となっております。これらの研究業務は基本的に化合物を中心に展開されるもので、この意味で”化学”データサイエンスおよび人工知能となります。化学の分野への人工知能やデータサイエンスの適用は、歴史的に新しいものではなく、長期にわたり展開されてきたものです。現在のデータサイエンスや人工知能は営々と築かれてきた、化学分野の適用研究の基礎の上に展開されます。この意味で、化学のアナログ情報とコンピュータのデジタル情報との連携や融合の基本を理解しながら、最新のデータサイエンスや人工知能を適用することが極めて重要です。

 なお、TS-02の講義にて用いられた資料は「計算毒性学研究会」のホームページにアップされておりますので、興味ある方々はご参照ください。




2021年9月17日金曜日

⁂化学データサイエンスおよび人工知能関連講演会および教育講演のお知らせ

 CBI学会2021年大会では、計算毒性学関連講演会として、現在急速に展開されている化学データサイエンスおよび人工知能に関するフォーカストセッションとチュートリアル(教育)が開催されます。化学関連研究にデータサイエンスや人工知能の適用を考えている研究者の方々は奮って参加ください。


TS-02: チュートリアル 2021 年 10 月 25 日 13:00-17:00 
「半日で知る、化学分野のデータサイエンスおよび人工知能概要」: 
 「FS-08:化学データサイエンスおよび人工知能討論、勉強会」立ち上げ会協賛
 A Half-day Overview of Data Science and Artificial Intelligence in the Field of Chemistry: "FS-08: Chemical Data Science and Artificial Intelligence Discussion, Work Shop" Kick-off Meeting Sponsorship


FS-08:日時: フォーカストセッション 2021 年 10 月 28 日 13:00-14:30 
 「化学データサイエンスおよび人工知能討論、勉強会」立ち上げ会: 計算毒性学研究会主催
 "Chemical Data Science and Artificial Intelligence Discussion, Work Shop" Kick-off Meeting : Organized by the Computational Toxicology Study Group 



2021年1月4日月曜日

データサイエンスや人工知能におけるサンプルデータ: サンプル数とサンプルポピュレーション

 現在、データサイエンスや人工知能に関する研究では手法に関する研究が盛んである。

 しかし、データサイエンスや人工知能を用いて実際に適用しようとすると、機械学習に用いたサンプルデータの数や、ポジ/ネガ等のサンプルポピュレーションの問題が、最終的な解析結果の良否に大きく関係することがわかる。

 全く同じサンプルデータを用いた場合、解析手法や人工知能手法の改良や新規開発を行っても、ほとんどの場合大きな改善は見られない。大きなブレークスルーはデータ解析手法から人工知能に変換した場合等の、次元や発想の異なるレベルの手法的変化が必要である。

 同じデータ解析手法や人工知能の範囲での変化ではブレークスルーを導くような改善は期待できないと考えるべきである。

 一方で、機械学習に用いるサンプルデータに関する研究は手法と比較すると殆ど進歩していない。しかし、機械学習を適用するデータ解析や人工知能は手法を問わずすべてサンプルデータの良否が学習成果を大きく変化させることは明白である。

 即ち、標準的なデータ解析手法や人工知能手法を用いても、データサンプルを吟味した結果の方がより大きなブレークスルーを得やすいことである。これは、データ解析や人工知能をより正確で信頼性の高い状態で実施することが求められる現場においては極めて重要なポイントである。

2021年1月2日土曜日

2021年が素晴らしい年となるように願っております:The 2021 will be a wonderful and great year.

  昨年はコロナに翻弄され、日常生活を取り戻せませんでしたが、今年は通常の生活を取り戻せるようになることを願っております。


 2017年の正月に本ブログにて新年の挨拶をアップしましたが、いつの間にか4年も経ちました。この間データサイエンスや人工知能(AI)の展開は急速に進みました。研究の世界や日常生活においても、このデータサイエンスや人工知能の果たす役割や、研究対象としての存在は意識することが無く、むしろ自然に導入されているというような状況となってきました。

 4年前の本ブログを見て、データサンプルという観点から見ると現時点でほとんど変化していないことを強く感じます。データサイエンスや人工知能の開発や適用、信頼性確保という観点で最も重要なサンプルに関する議論や環境の整備が全く進んでいないことに驚きを感じました。

 従いまして今年は、データサイエンスや人工知能におけるサンプルデータの問題を主たるテーマとして討論してゆこうと考えております。

 今年もよろしくお願いいたします。

2017年1月15日日曜日

新年明けましておめでとうございます:今年は人工知能関連が大きくブレークするでしょう

 新年明けましておめでとうございます。 

 今年も皆様にとりまして素晴らしい年となるようにお祈りいたします。


 今年は人工知能関連が全ての面で大きくブレークする年となるでしょう。 最近は、殆ど毎日人工知能関連の記事が新聞上に掲載されるようになりました。
 昨年までは、深層学習が大きく取り上げられ、この技術により、従来は適用困難、不可能であった様々な分野への人工知能適用が可能となるという期待先行型で大きく取り上げられているという感じでした。 まだまだ期待先行で、ブーム的なイメージがありますが、最近は人工知能の適用分野や適用内容が急速に広がりつつあることを感じるようになりました。

 過去にも人工知能が大きく取り上げられ、様々な分野での人工知能適用が試みられた時がありました。 「第五世代コンピュータ(1982-1992)」として、国が主導で様々な分野での人工知能適用が試みられました。 私も、幾つかのプロジェクトで人工知能システム構築を行ないました。 当時は、現代と異なり、パーセプトロンの発展型であるニューラルネットワーク(バックプロパゲーション法(1986))等の技術は開発されておらず、いわゆるルールベース型の人工知能を展開していました。

 現在の人工知能を取り巻く環境は様々な観点で大きく変化しております。 インシリコ(コンピュータ)関連では、CPU機能の急激な向上で、計算速度の桁違いの高速化、さらにメモリーも桁違いに記憶量を増やし、ネットワークもインターネットにより世界との境界を取り去りました。 現在は、ICT、IoT、さらにはビッグデータと人工知能技術と連携する事が必要、あるいは連携する事で従来とは異なる効果や結果が期待できる環境が揃ってきました。 さらに、時代的な変化により、従来は夢と考えられてきた自動運転、ロボット技術等の様々な分野が、現実のものや必要技術となり、この面からも人工知能技術との連携や適用が必要となっています。

 従来は、物事の単純化による法則化、数式化等々によるアプローチが様々な分野で適用され、問題解決の王道として展開され、素晴らしい結果や効果をもたらしてきました。 しかし、現実の世界では様々な要因が絡み、それらの要因が相互作用を行ない、結果や予想が困難といった複雑な分野も多数存在します。 これらの複雑な問題に関する解決アプローチは避けて通ってきたというのが現状でした。
 現在は、ビッグデータということで集積されるデータ量もひと昔前に比べて桁違いに大きくなりました。 この結果、従来のデータ解析手法では精度を保った解析は実施困難となっています。 またIoTの展開により、従来は扱う事や集積が困難であったデータもリアルタイムで集積する事が可能となり、医療や健康という観点での新たな解析が可能となってきました。 このような大量/リアルタイムデータの解析に人工知能等の技術適用が期待されます。 また、自動運転のように、法則化する事が困難で、異常事態への対応が強く求められる分野でも、ルール化や例外を許さない従来のアプローチによる展開は困難で、このような分野での人工知能技術の適用は重要です。

 化学の分野では今年も様々な発見や技術の展開があるでしょう。 従来のアプローチは、発見や真理の追求が中心でした。 この目的に従って、メカニズム解明等を目的として様々な分析機器を駆使し、実験プロトコルを決定し、きれいなデータを集めてデータ解析や要因解析を行なってきました。 この結果に従って、創薬ターゲットとなる蛋白や化合物を決めて新たな薬物を展開するという流れでした。 ターゲット蛋白や化合物が決まった後の薬理活性最適化過程は発見と異なり、正に試行錯誤の連続です。 発見等を主目的とするメカニズム追求研究とは異なる文化の世界です。
 人工知能の適用は、前記のような試行錯誤を中心とした創薬過程で大きな効果を発揮するものと期待されます。 発見型の研究分野への適用も、様々なJoulnalを俯瞰的に眺めて新たな知見を見出す等の、人間には負荷の高い作業への適用が人工知能の高い効果を期待出来るものとなるでしょう。

 人工知能の展開が大きく期待され、必要となっている時代が来ていることを強く感じています。 インシリコ(コンピュータ)関連技術の大きな変化がもたらす二次的な変化が、従来の技術で対応する事が困難な現状を生み出し、従来技術の適用限界を超えるものとしての人工知能技術が期待されます。 また、従来は夢として扱われてきた技術が時代の要請や変化により、現実のものとして取り組む事が求められるようになり、このような分野でも人工知能の展開が必要となっています。

 今後は様々な分野で人工知能技術の展開が期待されます。 特に本ブログで取り上げる、化合物や生体を適用対象とする分野では、人工知能技術を適用する時に様々な留意点が存在する事も事実です。 これらの留意点を認識し、クリアする事が出来なければ、人工知能を適用しても正しい結果が得られないだけでなく、間違った答えに導かれる可能性が高くなることのあることを強く意識する事が必要です。
 化合物に関する様々な分野、生体が関与する医療関連の様々な分野。 これらの分野への正しい人工知能の適用が今後強く要求されるでしょう。

2024年度のノーベル賞について。ノーベル賞の受賞対象範囲や該当分野が大きく変化した。

  今回のノーベル物理学賞はAI 関連研究に授与されました。これは、従来のノーベル物理学賞の受賞範囲には無い範疇で、物理というよりは情報学分野であり、しかもアルゴリズムに関する研究という点で、ノーベル賞の選考委員会が時代を変える新たな分野にも展開しようとする大きな流れを示すものと...