AI時代を支えるAIの研究討論ブログ

　時代が「AI時代」へと変化するに伴い、新時代を支える基本技術はAIであることは明白です。AIは他の研究と融合されて様々な利点や効果を生み出すことが期待されるし、この実現が求められます。
　AI技術は極めて重要な技術ですが、このAI技術を理解せずに他の技術との連携・融合を行うことは極めて危険です。AI以外の研究者も、AIに関するある程度の基本技術の理解が必要です。
　AIはAI研究者に任せるということも主張されますが、AI導入研究は融合研究や境界領域研究となります。このような異分野の研究の展開では異分野研究者の相互理解が必要です。この場合、ある程度AI関連研究の基本の理解も必要です。これが無い時は、AIと他の研究者間で意思疎通が困難となり、互いに自分の主張を行うだけの議論となります。
　「情報時代」において、化学・創薬研究分野への情報化学や化学情報学（ケモメトリクス）が発展したように、「AI時代」にはAI 化学やAI情報化学の展開が必要となります。
　　本ブログではAI研究者と個別研究者との討論や連携を効率的に行うためのAIの基本技術の理解を目指します。

2021年1月4日月曜日

データサイエンスや人工知能におけるサンプルデータ：　サンプル数とサンプルポピュレーション

　現在、データサイエンスや人工知能に関する研究では手法に関する研究が盛んである。

　しかし、データサイエンスや人工知能を用いて実際に適用しようとすると、機械学習に用いたサンプルデータの数や、ポジ／ネガ等のサンプルポピュレーションの問題が、最終的な解析結果の良否に大きく関係することがわかる。

　全く同じサンプルデータを用いた場合、解析手法や人工知能手法の改良や新規開発を行っても、ほとんどの場合大きな改善は見られない。大きなブレークスルーはデータ解析手法から人工知能に変換した場合等の、次元や発想の異なるレベルの手法的変化が必要である。

　同じデータ解析手法や人工知能の範囲での変化ではブレークスルーを導くような改善は期待できないと考えるべきである。

　一方で、機械学習に用いるサンプルデータに関する研究は手法と比較すると殆ど進歩していない。しかし、機械学習を適用するデータ解析や人工知能は手法を問わずすべてサンプルデータの良否が学習成果を大きく変化させることは明白である。

　即ち、標準的なデータ解析手法や人工知能手法を用いても、データサンプルを吟味した結果の方がより大きなブレークスルーを得やすいことである。これは、データ解析や人工知能をより正確で信頼性の高い状態で実施することが求められる現場においては極めて重要なポイントである。

0 件のコメント:

コメントを投稿

登録: コメントの投稿 (Atom)