琥珀色呑んだくれ備忘録

メモとか備忘録とか

2018-01-01から1年間の記事一覧

XGBoostExplainerが何をやっているか調べる(4.モデルから予測ルールを抽出する)

目的 関連シリーズ 準備:XGBモデルの学習と予測 学習したxgboostのルール抽出 xgb.model.dt.tree()によるパスの抽出 予測値の再分配 Cover (H)の再計算 勾配(G)とweightの再分配 各ルールのインパクトの集計(Tree Breakdown) 目的 今回は、xgboostExplain…

XGBoostExplainerが何をやっているか調べる(3.予測結果の再構成プロセスを眺める)

目的 関連シリーズ 準備 XGBモデルの学習と予測 予測ルールを抽出する 予測値を再構成する overview 対象の予測 初期化 対象のtreeの取り出し 対象のleafのとりだし 検算 目的 今回は、インスタンスの予測結果が再構成されるプロセスを、explainPredictions(…

XGBoostExplainerが何をやっているか調べる(2.可視化プロセスを眺める)

目的 関連シリーズ 予測結果の可視化プロセスをstep-by-stepで眺める 準備 XGBモデルの学習と予測 可視化の手続き overview 学習したxgboostのモデルから予測ルールを抽出する 指定したインスタンスの予測結果を予測ルールから分解再構成する 分解再構成した…

XGBoostExplainerが何をやっているか調べる(1.とりあえず使う)

目的 関連シリーズ 参考 とりあえず使ってみる インストール XGBモデルの学習と予測 個別の予測結果の可視化 STEP.1. 学習済みXGBモデルからルールセット(leafまでのパス)を列挙してテーブル化 STEP.2. Get multiple prediction breakdowns from a trained…

[感想]『自然科学研究のためのR入門』

全体 対象としない読者 COI 1章:RmarkdownとRstudioを使う 2,3,4章:統計モデリング、実験計画法と分散分析を使った分析とレポーティング 5章:機械学習(など)を使った分析のレポーティング AUCROCによるパフォーマンスの比較について 6章:集大成 結論:…

Windows 10 で GPU(CUDA)を利用するLightGBM のR-packageをセットアップする

基本的には公式サイトのガイドに従ってセットアップするだけ。だけなのだが、ちょこちょこ入れ忘れとか落とし穴があったりして、次から手間取らないように備忘録にしておく。 全体の準備 32bit 版のRをインストールしない わりと嵌まったポイント。LightGBM…

autoxgboost を使ってみる

前回のTokyoRで@hoxo-mさんがつぶやいていたautoxgboostを使ってみる。 xgboost の自動パラメータ調整は autoxgboost というのが便利そうだった。#tokyorhttps://t.co/LvwY9U2zyx— hoxo_m (@hoxo_m) 2018年7月15日 何? autoxgboostは、mlr と mlrMBOを使っ…

(修正あり)arulesの結果をdata.frameで探索する

R標準のデータフレーム+dplyr等で、探索的にルール抽出⇔眺めるのにパッケージを作った。本家のarulesだとちょっとやりにくいなあと思っている人むけ。 使いかた arules::inspect() の代わりに inspectDF() するだけ。 arules::DATAFRAME() でデータフレーム…

既存のGithubのレポジトリをRStudioでcloneする

RStudioの操作だけで完結したい人向け。タイトル通りのことしたくて戸惑ったので備忘録。(1) File > New Project... > Version Control > Git (2) 既存のレポジトリのアドレスをコピー (3) コピーしたアドレスを(1)に張り付け (4) clone完了 あとは、ローカ…

random forestを使った解釈性にもとづく推薦システム

[1706.06691] Interpretable Predictions of Tree-based Ensembles via Actionable Feature Tweakingという論文が提案されている。KDD2017でYahoo Researchの研究者によって発表されたもの、とのこと。Ensemble treesによって、あるサンプルがラベルAと予測…