令和元年度 秋期 応用情報処理技術者試験 午前 問4
問題
AI の機械学習における教師なし学習で用いられる手法として, 最も適切なものはどれか。
ア 幾つかのグループに分かれている既存データ間に分離境界を定め, 新たなデータがどのグループに属するかはその分離境界によって判別するパターン認識手法
イ 数式で解を求めることが難しい場合に, 乱数を使って擬似データを作り, 数値計算をすることによって解を推定するモンテカルロ法
ウ データ同士の類似度を定義し, その定義した類似度に従って似たもの同士は同じグループに入るようにデータをグループ化するクラスタリング
エ プロットされた時系列データに対して, 曲線の当てはめを行い, 得られた近似曲線によってデータの補完や未来予測を行う回帰分析
解説
AI における 機械学習 の学習方法は、教師あり学習 、教師なし学習 、強化学習があります。
教師あり学習は、データに対して正解を教えます。動物の画像を学習させるために、猫の画像のデータと、正解である「猫」というラベル、別の犬の画像では、「犬」という正解ラベルをセットにします。この何種類ものデータから、新しいデータに対して、この画像は、「猫」の確率が高い。ということが判定できるようになります。
一方、教師なし学習は、正解ラベルを渡しません。何も教えない。ということになります。
トレーニングデータのみを与えて、AIは何が行えるでしょうか。1つの例として、クラスタリング が挙げられます。クラスタリングとは、与えられたデータの特徴から、データのグループをいくつかに分ける手法になります。ECの売上データから、顧客をいくつかのグループに分けて、売上アップの対策を取っていくなどの利用が考えられます。このグループは、どのように分かれるかは、人間が決めているわけではないため、どのようなグループになっているか、説明ができないこともあります。
強化学習は、行動を学習する仕組みになります。目的とする報酬(スコア)を最大化するためにはどのような行動をすれば良いかを学習します。
スコアを与えるので、教師あり学習と似ていますが、1つのデータに対して、正解ラベルとペアにするのが、教師あり学習ですが、強化学習は、一連の行動系列の結果としてのスコアを最大化します。
それでは、選択肢を見ていきます。
ア 既存データ間に分離境界を定めています。これは、それぞれのデータに対して正解ラベルを与えて、学習をさせて分離境界を定めています。教師あり学習になります。
イ モンテカルロ法は、強化学習の1つとなります。円周率の値を求める説明がよく出ています。乱数によって、擬似データであるランダムな点を作って、円の外側になるか、円の内側に入るかの確率を計算するということがあります。一連のデータから、平均を算出することで、真値に近づけています。
ウ データ同士の類似度をAIが定義しています。正解データを与えているわけではありません。これが教師データの特徴になります。
エ 時系列データをプロットするのいは、その時点での正解を与えてプロットしています。正解を与えている教師あり学習になります。回帰分析は、教師あり学習の手法の1つになります。
正解
ウ データ同士の類似度を定義し, その定義した類似度に従って似たもの同士は同じグループに入るようにデータをグループ化するクラスタリング
あらためて問題と正解
AI の機械学習における教師なし学習で用いられる手法として, 最も適切なものはどれか。
ア 幾つかのグループに分かれている既存データ間に分離境界を定め, 新たなデータがどのグループに属するかはその分離境界によって判別するパターン認識手法
イ 数式で解を求めることが難しい場合に, 乱数を使って擬似データを作り, 数値計算をすることによって解を推定するモンテカルロ法
ウ データ同士の類似度を定義し, その定義した類似度に従って似たもの同士は同じグループに入るようにデータをグループ化するクラスタリング
エ プロットされた時系列データに対して, 曲線の当てはめを行い, 得られた近似曲線によってデータの補完や未来予測を行う回帰分析
■正解
ウ データ同士の類似度を定義し, その定義した類似度に従って似たもの同士は同じグループに入るようにデータをグループ化するクラスタリング