未分類

サイトリニューアルしました

サイトリニューアルしました! 経緯としては、だいぶ遅かったのですが、ようやくこのサイトのSSL対応をそろそろやろうと思い立って、渋々と重い腰を持ち上げてやり始めたのがきっかけです。 ただ、そこで色々と問題がありました。
Python

最適化問題(TSP)を深層強化学習で解いてみた

今回は数理最適化問題を深層強化学習で解くアプローチについて書きます。 前回、巡回セールスマン問題(TSP)について、混合整数計画問題(MIP)としての解き方をPuLPで実装しました。 今回は、TSPについて深層強化学習を使った解き方をPyTorchで試してみます。
Python

PuLPで数理最適化問題(TSP、VRP)

数理最適化問題の中でもNP困難の基本的な問題の1つ、巡回セールスマン問題と、その一般化、運搬経路問題を、PuLPで解いてみます。 PuLPは、最適化問題を解くためのPythonライブラリです。 今回は、このライブラリを使って、巡回セールスマン問題および運搬経路問題を、混合整数計画問題として解いてみます。
Python

SIRモデルで新型コロナウイルスの感染者数の収束を予測してみた

SIRモデルのパラメータの推定は、オーソドックスには最尤推定などが用いられるようですが、今回はベイズで定式化して、ベイズ推定もやってみました。 国別のデータを使った分析は最近よく見ますので、今回は以下のデータを使って、都道府県別の感染流行の予測を行ってみます。
Python

Grad-CAM、Grad-CAM++、Score-CAMを実装・比較してみた

今回は表題の通り、画像系深層学習の判断根拠手法について、近年人気のある手法「Grad-CAM」と、その改良版「Grad-CAM++」、さらに去年論文発表されたばかりの「Score-CAM」を、TensorFlow/Kerasで実装・比較してみます。
Python

Bi-LSTM学習におけるバッチごとの系列長調整について

深層学習でのBi-LSTMなどの系列学習において、バッチごとに系列長を調整できるようにしてみます。 例えば、Kaggleのカーネルコンペなどで、自然言語の分類をLSTMなどで学習させる場合、バッチごとに系列長を調整する方が、学習精度・実行時間短縮に効果があるようです。
Python

機械学習モデルを解釈する指標SHAPについて

今回は、機械学習モデルの解釈性に関する指標「SHAP」について書きます。 機械学習モデルを学習させた時に、実際にモデルはどの特徴量を見て予測をしているのかが知りたい時があります。 木構造アルゴリズムでは、特徴量の境界で切り分けた時のジニ係数を元にして、どの特徴量が効いているかを
Python

WordCloudとpyLDAvisによるLDAの可視化について

潜在ディリクレ配分法(LDA; Latent Dirichlet Allocation)によるトピックモデルを学習させて、WordCloud・pyLDAvisで可視化までやってみます。 今回は日本語でやってみたかったので、以下のlivedoorニュースコーパスを利用させていただきました。
Python

因子分析でテニスのサーブ力・リターン力を定量化してみた

各選手には、サーブが得意な選手やリターンが得意な選手がいると思います。 そこで、今回は、各選手にサーブ力とリターン力の潜在変数があると仮定して、これを因子分析で推定し定量化をしてみました。 結構なサイズのファイルで、一気に読み込むことは不可能でした。
Python

文書分散表現SCDVと他の分散表現を比較してみた

今回は、以下の論文の文章分散表現、SCDVについて書きます。 SCDVは、文章ベクトルを取得する方法の1つです。 文章ベクトルを取得する手法はDoc2Vecなど色々ありますが、論文において、取得した文章ベクトルを用いたマルチラベル分類では、他の方法よりも高い精度を出せているようです。
Python

クレジットカード不正利用予測モデルを作成・評価してみた

表題の通り、Kaggleデータセットに、クレジットカードの利用履歴データを主成分化したカラムが複数と、それが不正利用であったかどうかラベル付けされているデータがあります。 - 今回は普通に、このデータを用いてクレジット...
未分類

分析環境をDockerでコンテナ管理するようにしてみた

これまでプライベートの分析環境については、 アドホックな分析は、ローカル端末上のpyenvで仮想環境として管理 深層学習などは、クラウド上で環境構築手順を管理しておいて実行 といったやり方で管理・運用していました。 これを今回、Dockerのコンテナとして分析環境を管理するようにしてみました。
読書

数学ガールシリーズ読書感想

数学ガールは、結城浩氏による数学を題材にしたシリーズ小説であり、今年の4月に発売された「ポアンカレ予想」を含め、現在以下の6作が出ています。 数学ガール -フェルマーの最終定理- 数学ガール -ゲーデルの不完全定理- 数学ガール -乱択アルゴリズム- 数学ガール -ガロア理論- 数学ガール -ポアンカレ予想-
Python

テクニカル分析で買いシグナルからの株価推移を調べてみた

実際にテクニカル分析でよく使われている指標をPythonで実装してみて、過去の株価推移のデータで効果について調べてみました。 ちなみに私は金融素人なので、専門家から見れば、とんちんかんなことをやっている可能性ありです。
Chainer

Dropoutによる近似ベイズ推論について2

以前に、Dropoutによる近似ベイズ推論に関する記事をあげました。 上記では、ソフトマックス関数の出力値の平均を、カテゴリカル分布のパラメータと見て、その不確実性をエントロピーとして算出していました。
Python

TensorFlow Eager Executionを試してみた

TensorFlow 1.5が公開され、TensorFlowをDefine by Runで実行できる「Eager Execution for TensorFlow」が追加されました。 今回はTensorFlowにDefine by Runモードが追加されると聞いて少し気になっていましたので、実際に動かしてみて操作感を確認してみました。
Python

ベイズモデリングで男子プロテニスの強さを分析してみた

Kaggleのデータセットで公開されている、男子プロテニスの試合結果データがありましたので、これを使って各プレイヤーの強さをモデル化してみます。 今回は、開催した年と、勝ったか負けたか、その時の勝ちプレイヤー、負けプレイヤーの情報だけで、各プレイヤーの強さを分析してみます。
Chainer

Dropoutによる近似ベイズ推論について

割と今更ですが、深層学習において、汎化性能を保つための工夫の一つであるDropoutを使って推論を行うことが、近似的にベイズ推論になっているという論文がありますので、それについて記します。 また、実際に試験的にMNIST画像分類で推論をしてみて、様子について確認してみようと思います。
統計検定

統計検定2級の試験対策について

以前、統計検定2級を受験しました。 今回は統計検定2級の受験対策に関して記そうと思います。 以前に準1級の対策についても記していますので、準1級の試験対策については、以下を参照してください。 参考書籍
Edward

Edward、PyStan、PyMC3で状態空間モデルを実装してみた

状態空間モデルの勉強をしていましたので、実装について書きます。 PyStanやPyMC3の実装は、ある程度参考になる例が多いのですが、Edwardの実装例は見当たりませんでしたので、どんな感じになるか試しに実装してみました。
Plotly

インタラクティブなグラフ生成ライブラリPlotlyについて

Plotlyというマウスでぐりぐりと動かせるようなインタラクティブなグラフを生成するライブラリがあります。 最近これをよくJupyter notebook上で可視化して遊んだりしていますので、これについてまとめます。
Chainer

Chainerによる転移学習とファインチューニングについて(VGG16、ResNet、GoogLeNet)

画像系の深層学習では、学習済みモデルの重みを利用する「転移学習」や「ファインチューニング」と呼ばれる手法がよく利用されます。 ILSVRCなどの画像認識コンペで優秀な成績を収めたモデルのネットワークアーキテクチャを深層学習のライブラリで構築し、公開されている学習済みの重みファイルを読み込ませて利用するという流れで実装します。
Python

白線の教師なしセマンティックセグメンテーションを頑張ってみた

セマンティックセグメンテーションは、画像系ディープラーニングの一種で、画素レベルでそれが何かを認識するタスクを行う手法です。 教師なし学習である程度アノテーションの補助はできるようにならないかを考えてみます。 例えば、RGB情報(色)でのクラスタリングや、学習済みモデルによる転移学習で、ある程度、画素レベルの特徴分けができるかをやってみます。
Chainer

深層強化学習でシステムトレードしてみたかった

今回は以下のアルゴリズムで、株価のデータから、システムトレードをするエージェントを学習させてみました。 DQN Double DQN Dueling Double DQN Dueling Double DQN + Prioritized Experience Replay
Chainer

Kaggleの氷山コンペに参加してみた

(adsbygoogle = window.adsbygoogle || []).push({}); 今更ですが、明けましておめでとうございます。 表題の通り、Kaggleの氷山コンペにソロで参加していましたので、簡単にですが、...
Edward

ベイジアンニューラルネットワークで毒キノコ分類を実装してみた

(adsbygoogle = window.adsbygoogle || []).push({}); 最近勉強中のEdwardを使って、ベイジアンニューラルネットワークを実装してみました。 公式ページには、ちょっとした参考程度...
Chainer

Chainerでファインチューニングして特徴量抽出してみた

(adsbygoogle = window.adsbygoogle || []).push({}); さらに続きとしてやってみました。 前回は、花の画像データセットで、VGG16の学習済みモデルを使って特徴量を抽出してみました...
Chainer

Chainerで転移学習・特徴量抽出して類似度を測ってみた

(adsbygoogle = window.adsbygoogle || []).push({}); 一応、前回の続編的な感じになります。 前回は自己符号化器で画像の画素値を次元圧縮し、得られた特徴量を使って類似度計算を行って...
Python

TensorFlowで自己符号化器で特徴量抽出して類似度を測ってみた

(adsbygoogle = window.adsbygoogle || []).push({}); 表題の通り、画像データセットから自己符号化器で特徴を学習し、類似度を測ってみました。 データセットはKaggleからお借りし、...
Python

TensorFlowでニューラルネットワーク、CNNを実装してみた

(adsbygoogle = window.adsbygoogle || []).push({}); 今回は、TensorFlowでニューラルネットワーク、畳み込みニューラルネットワークの実装について記します。 以前にChain...
Python

PyTorchで深層強化学習(DQN、DoubleDQN)を実装してみた

(adsbygoogle = window.adsbygoogle || []).push({}); 以前に勉強したDeep Q-Network(DQN)を、やっぱり離散的な状態を返す簡単なゲームでなく、連続的な状態のゲーム...
Chainer

畳み込みニューラルネットワークで為替予測してみたかった

(adsbygoogle = window.adsbygoogle || []).push({}); タイトルの通り、為替データを畳み込みニューラルネットワーク(CNN)で読み込んで予測させるまでを、Chainerで実装してみま...
統計検定

統計検定準1級の試験対策について

(adsbygoogle = window.adsbygoogle || []).push({}); 先日、統計検定準1級を受験し、無事合格しました。 今回は、実際に行った準1級受験対策として、勉強で取り扱った書籍や、どの程...
スポンサーリンク