機械学習(Machine Learning)
最近もっぱらscikit-learnをいじっているのですが、クロスバリデーションってどうやるんだろうと思い調べてました。 非常にシンプルな例ですが、sckit-learnに付属しているテストデータを使って実際にやってみます。ちなみにpython2.7.10を使ってます。sciki…
前回に続けて文章を機械学習のインプットにしたいので、文章解析処理を学習するため「言語処理100本ノック」をやります。今回は一気に飛ばして第8章の機械学習にいってみます。 前回の「mecabで形態素解析したものをマッピングオブジェクトに突っ込む」はmec…
機械学習に絶賛ハマり中の原田です。 機械学習でこんなあんなことやことできないかなーって色々考えるのですが、結構文章を解析してごにょごにょする必要があるケースが多くて、そうすると日本語をパラメータにして機械学習させることになるので、形態素解析…
受験シーズンも佳境にはいってきて合格通知が届いて人もいると思います。そこで、1日目のテストを受けてその夜に本命合格がわかり、2日目を受けなかった人で、そのまま試験をしていたら合格していたのか気になる人のために合否判定ツールを作ってみたいと思…
相変わらず機械学習の勉強にハマっているのですが、今はニューラルネットワークのバックプロパゲーションあたりを勉強してます。 勉強も楽しいのですが、何か実践で使えるものをやりたいなーと思って、並行してtensorflowで色々試しているところです。 線形…
デブサミ2016でDataRobotのセッションをみて感激したのですが、そのときにTensorFlowのデモもちょっとだけやっていて、試したくなりました。ぼくはRubyistなのでPythonをあまり書いたことがないのですがチャンレンジしてみます。 TensorFlowをインストール …
前回のエントリで線形回帰で実際に予測することまで出来たので、今回はロジスティック回帰で予測してみます。 機械学習で、ラーメン屋のレビュー件数から評価点がどれくらいになるか予測する 今回は、賃貸情報サイトのSUUMOで、「渋谷駅」で検索した中から、…
データはラーメンデータベースで「渋谷」で検索した上位20件を使用した。 前回、最急降下法を実装して線形回帰のθの値を探索してみたけどうまくいかなかったという記事を書きましたが、どうやらfeature scaling(feature normalization)をして収束することに…
前回のOctaveで散布図をプロットしてみるに続いて、今後はOctaveで最急降下法を実装して、θの値を探索してみます。 結論から言うと失敗した。どこかfeature scalingで間違っているっぽいんだけど、どう間違っているのかがわからず。改めてリベンジしたい。ひ…
前回に引き続き機械学習のインプット中ですが、機械学習で数式ばっかりコネコネやっていると、その数式が示していてるものを可視化したくなるときがあります。目的関数がボウル型になることや、仮説関数の線形などを目で見て確認したくなってきます。 なので…
Octaveは数値解析を目的にしたプログラミング言語で、機械学習のコードを実装するときの試作としてよく使われるらしい。RとかJavaとかPythoonとかが機械学習で使われることが多いけども、試作レベルならOctaveが手っ取り早いっぽい。 インストールにちょっと…
目的関数の実装 おとといあたりに【機械学習入門】線形回帰と仮説関数というエントリを書きましたが、関連して目的関数(cost function)というものがあります。 目的関数は、仮説関数を導くための関数で、簡単に言うと、グラフにプロットされた訓練セットの一…
前回エントリで「教師あり学習」には「回帰問題」と「分類問題」という種類があるということを書きましたが、今度はこの「回帰問題」のアルゴリズムの1つである「線形回帰」について書いてみます。 機械学習に入門するときに一番最初にやったこと | もふも…
2015-2016年の年末年始を利用してはやりの機械学習で遊んでみようと思った。mofmof inc.はRailsの会社だけども、新しいテクノロジーも積極的チャレンジしていきたいのでね。 機械学習の超初心者は何から始めるべきか? 機械学習のアルゴリズムの種類 教師あ…