人工知能(AI)システム構築時に必要となるのは、人工知能システムと学習に用いる学習データです。ニューラルネットワーク型人工知能の特徴として学習用サンプル数が大きいことは良く知られた事実です。 ということで、人工知能システムに学習データを入力して学習させてて知識を構築して適用すると、うまく動かないことがしばしば発生します。 この多くの場合は、データサンプル数が多くても、その学習データの質が適用目的を実施するのに必要な情報や事例を含んでいないことが原因となります。 これは当然ですね。 人間であっても、当面の解決目標達成に必要とする事象についての知識やノウハウを学習していなければ、知識の適用に失敗してしまします。 この典型的な事例は、事象の成功事例ばかり多数学習して、失敗事例を殆ど学習していない場合です。 これは通常の多変量解析・パターン認識でも発生する問題です。 偏った情報を用いた場合、多変量解析・パターン認識は多数の学習データ側に有利な解析を実施します。 これは人工知能であっても同じです。
人工知能の学習:
1.学習サンプル数の問題2.学習サンプルの質(内容)の問題
①ターゲットとなる獲得知識やノウハウ構築に必要な情報を含まない学習データ
②偏った情報のみで構成される学習データ