2022年6月25日土曜日

人工知能は人間と同じで、学習しなければ賢くなりません:学習データについて考えます(I)

 現在のニューラルネットワーク型の人工知能はデータから学習するので、学習に用いるデータが極めて重要というのは理解できますね。 これに対して従来からの知識ベース型人工知能は、知識自体がシステムに入力されるので、改めて学習する必要はありません。 この場合は、知識を入力する人間が人工知能の代わりに学習し、その結果をまとめて人工知能システムがわかる形で入力(教え込み)します。 

 では人工知能の学習に用いるデータは、どのようなものや条件を満たしていることが必要でしょうか。 現時点で良く分かっていることは、ニューラルネットワーク型人工知能の学習にはかなりの数のサンプルデータが必要だということです。 これに対してルールベース型の人工知能で用いる知識というものは、人間が学習するものなので量的に多いというよりは、まとめやすく、人間が処理できる量で、様々なノウハウを受けて構築されます。 この点で、ルールを設定する過程で、ルールを明確にするようにデータ自体が人間により選択、整理されたものが集めてまとめられます。 この作業は専門分野のエキスパートの関与が必要となります。 この結果、ルールベース型人工知能で求められるデータはルールを作り出す人間が必要とするものであり、その量はニューラルネットワーク型人工知能で用いる学習データよりもかなり少ない量で実施されます。


 上図で示されるように、ニューラルネットワーク型人工知能では大量の学習データが必要となります。 一方で、ルールベース型人工知能は少ない数の学習データで済みますが、人工知能システムが必要なのは知識(ルール)であって、学習データは直接用いません。 その代わりに、知識(ルール)の作成する人間はルールの作成に学習データを必要としますが、そんなに多くのデータではなく、良く整理され、情報的にクリーンなものが利用されます。



 

0 件のコメント:

コメントを投稿

<p><b><span style="color: blue; font-size: x-large;">新たなブログ名称および内容の案です:<br>This is a proposal for a new blog name and content.</span></b></p>

   新ブログを構成するにあたり以下の点を留意しつつ検討いたしました。 ■討論テーマは来るべき「情報時代」に相応しい内容とする ・新たな技術等に関する積極的な討論を目指す。 ・「情報時代」の基盤技術となる大規模言語モデルや種々生成AIを主たるテーマとする。 ■従来型の基本的な分野...