ほんとのこと知りたいだけなのに。

夏休みはもうおわり。

CLML を眺めてみる。

統計・機械学習 的なことをやりたいので CLML を眺めてみることにした。

github.com

どんな機能があるのか眺めてみた。

README の Machine-Learning Packages のセクションを表にしてみた。

ふーん。と言った感じである。 自分は別に数学に詳しい訳ではないので何が出来るのかわからない。

まぁ、どれか一つをやってみるか。

Package Description
Association-Rule アソシエーションルール分析のパッケージ
ChangeFinder オンライン変化点検出エンジン ChangeFinder のパッケージ
Cluster-Validation クラスタリング結果を評価する指標のパッケージ
Decision-Tree 決定木分析のpackage
Dirichlet-Process-Mixture 混合ディリクレ過程によるクラスタリングのパッケージ
Exponential-Smoothing (HoltWinters) 時系列解析における指数平滑化法のパッケージ
Hierarchical-Clustering 階層型クラスタリングのパッケージ
Hierarchical-Dirichlet-Process-Latent-Dirichlet-Allocation 階層的ディリクレ過程を用いた隠れディリクレ配分法のパッケージ
K-Nearest-Neighbor k-近傍法(k-nearest neighbor algorithm) の pacakge
K-means k-平均法(k-means) クラスタリングのパッケージ
Linear-Regression 線形回帰分析のパッケージ
Naive-Bayes 多変数ベルヌーイナイーブベイズおよび多項ナイーブベイズのパッケージ
Non-negative-Matrix-Factorization 非負行列因子分解のパッケージ
One-Class-SVM one-class-SVMのパッケージ (教師なし学習で、異常値・外れ値検出を行う)
Optics 密度ベースクラスタリング OPTICS のパッケージ
Principal-Component-Analysis 主成分分析のためのパッケージ
Random-Forest ランダムフォレストのpackage
Read-Data 機械学習対象データを読み込むためのパッケージ
Self-Organizing-Map 自己組織化マップのパッケージ
Spectral-Clustering 無向グラフを対象としたクラスタリングのパッケージ
Support-Vector-Machine サポートベクターマシンのパッケージ
Support-Vector-Regression サポートベクター回帰のパッケージ
Text-Utilities テキストユーティリティ関数のパッケージ
Time-Series-Anomaly-detection 時系列データにおける異常検知アルゴリズムのパッケージ
Time-Series-Auto-Regression 時系列解析における自己回帰モデルのパッケージ
Time-Series-Burst-Detection 時系列データにおけるバースト検知アルゴリズムのパッケージ
Time-Series-Read-Data 機械学習対象データを時系列データとして読み込むためのパッケージ
Time-Series-State-Space-Model 状態空間モデル(時系列モデルを抽象化したもの)のパッケージ, これを用いて色々な時系列モデルを表現する。
Time-Series-Statistics 時系列データ(time-series-dataset) を対象とした解析パッケージ

ディレクトリ構造を眺めてみる。

こんな感じ。

なんかごちゃごちゃしとる。 スゲー整理したい。。。

/
├─ aclml-db
├─ addons
├─ blas
├─ demo
├─ distribution
├─ docs
├─ graph
├─ lapack
├─ lib
├─ memo
├─ nearest-search
├─ nonparametric
├─ notes
├─ sample
├─ som
├─ statistics
├─ statvis
└─ test

知識工学部/機械学習 にCLMLの全体概要っぽい情報があります。