教師なし学習について記事にまとめました。
教師なし学習
教師なし学習は「教師あり学習」と対照的で、正解となるラベルはないです。
例えば、写真が大量にありますが、その中に、写っているのは、犬なのか猫なのかというラベル(分類したいカテゴリー)が持っていません。
教師なし学習では、こういったデータから規則性とパータンを発見するのが目的となります。
教師なし学習は何をするものなのか、何ができるかについて見ていきましょう。
教師なし学習のタスク(何をするのか、何ができるのか)
- クラスタリング(clustering)
クラスタリングは、下の図解のように、データの属性によってグループになる傾向を見つけ出すことです。
上のグラフを人間の目で見ると、なんとなくデータを三つのグループに分けられるのが分かりますが、平面上このふうに表現できない場合もあります。しかし、コンピュータでは、これをクラスタリングという手法で実現可能です。
- 可視化(visualization)と次元削減(dimension reduction)次元削減は教師あり学習のために前処理として、よく使われます。
- 相関ルール学習
- 異常検知(anomaly detection)
教師なし学習の重要アルゴリズム
1)クラスタリング・k-平均
・階層型クラスタ分析
・EMアルゴリズム(expectation maximization:期待値最大化法)
2)可視化と次元削減
・PCA(principal component analysis)主成分分析:よく使われる優秀な次元削減アルゴリズムです。Scikit-learnのライブラリにも実装されています。教師あり学習の前処理として役に立ちます。
・カーネルPCA
・LLE(locally linear embedding)
・t-SNE(t-distributed stochastic neighbor embedding)
3)相関ルール学習
・アプリオリアルゴリズム
・eclatアルゴリズム
[amazonjs asin=”B075GSMZDS” locale=”JP” title=”やさしく学ぶ 機械学習を理解するための数学のきほん アヤノ&ミオと一緒に学ぶ 機械学習の理論と数学、実装まで”]