サイトアイコン KOKENSHAの技術ブログ

教師なし学習

教師なし学習について記事にまとめました。

 

教師なし学習

教師なし学習は「教師あり学習」と対照的で、正解となるラベルはないです。

例えば、写真が大量にありますが、その中に、写っているのは、犬なのか猫なのかというラベル(分類したいカテゴリー)が持っていません。

教師なし学習では、こういったデータから規則性とパータンを発見するのが目的となります。

教師なし学習は何をするものなのか、何ができるかについて見ていきましょう。

教師なし学習のタスク(何をするのか、何ができるのか)

クラスタリングは、下の図解のように、データの属性によってグループになる傾向を見つけ出すことです。

上のグラフを人間の目で見ると、なんとなくデータを三つのグループに分けられるのが分かりますが、平面上このふうに表現できない場合もあります。しかし、コンピュータでは、これをクラスタリングという手法で実現可能です。

教師なし学習の重要アルゴリズム

1)クラスタリング・k-平均
・階層型クラスタ分析
・EMアルゴリズム(expectation maximization:期待値最大化法)

2)可視化と次元削減
・PCA(principal component analysis)主成分分析:よく使われる優秀な次元削減アルゴリズムです。Scikit-learnのライブラリにも実装されています。教師あり学習の前処理として役に立ちます。
・カーネルPCA
・LLE(locally linear embedding)
・t-SNE(t-distributed stochastic neighbor embedding)

3)相関ルール学習
・アプリオリアルゴリズム
・eclatアルゴリズム

 

教師あり学習

機械学習・深層学習のためのPython環境構築(PC版)

[amazonjs asin=”B075GSMZDS” locale=”JP” title=”やさしく学ぶ 機械学習を理解するための数学のきほん アヤノ&ミオと一緒に学ぶ 機械学習の理論と数学、実装まで”]

 

モバイルバージョンを終了