教師なし学習

はてなブックマーク - 教師なし学習
LINEで送る
Pocket

教師なし学習について記事にまとめました。

 

教師なし学習

教師なし学習は「教師あり学習」と対照的で、正解となるラベルはないです。

例えば、写真が大量にありますが、その中に、写っているのは、犬なのか猫なのかというラベル(分類したいカテゴリー)が持っていません。

教師なし学習では、こういったデータから規則性とパータンを発見するのが目的となります。

教師なし学習は何をするものなのか、何ができるかについて見ていきましょう。

教師なし学習のタスク(何をするのか、何ができるのか)

  • クラスタリング(clustering)

クラスタリングは、下の図解のように、データの属性によってグループになる傾向を見つけ出すことです。

上のグラフを人間の目で見ると、なんとなくデータを三つのグループに分けられるのが分かりますが、平面上このふうに表現できない場合もあります。しかし、コンピュータでは、これをクラスタリングという手法で実現可能です。

  • 可視化(visualization)と次元削減(dimension reduction)次元削減は教師あり学習のために前処理として、よく使われます。
  • 相関ルール学習
  • 異常検知(anomaly detection)

教師なし学習の重要アルゴリズム

1)クラスタリング・k-平均
・階層型クラスタ分析
・EMアルゴリズム(expectation maximization:期待値最大化法)

2)可視化と次元削減
・PCA(principal component analysis)主成分分析:よく使われる優秀な次元削減アルゴリズムです。Scikit-learnのライブラリにも実装されています。教師あり学習の前処理として役に立ちます。
・カーネルPCA
・LLE(locally linear embedding)
・t-SNE(t-distributed stochastic neighbor embedding)

3)相関ルール学習
・アプリオリアルゴリズム
・eclatアルゴリズム

 

教師あり学習

機械学習・深層学習のためのPython環境構築(PC版)

 

はてなブックマーク - 教師なし学習
LINEで送る
Pocket

Add a Comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

By continuing to use the site, you agree to the use of cookies. more information

The cookie settings on this website are set to "allow cookies" to give you the best browsing experience possible. If you continue to use this website without changing your cookie settings or you click "Accept" below then you are consenting to this.

Close