もふもふ技術部

IT技術系mofmofメディア

2020-03-01から1ヶ月間の記事一覧

spaCy + GiNZAを使って固有表現抽出とカスタムモデルの学習をしてみる

自然言語処理をするときはよくRasa NLUを使っているのですが、内部的にはspaCyが使われている模様です。どちらもパイプラインでモジュールをつなげていって自然言語処理をシンプルにするフレームワークだと理解しているのですが、spaCy単独で使うとどういう…

Kerasを使ってRNN(LSTM)でスパムメッセージの分類をしてみる

自社のサービスで、テキストを分類したりラベリングしたりということをやりたくなったので、文章タスクが得意らしいRNN(LSTM)で単純な分類問題を解いてみたい。 スパムメッセージ分類がちょうど良い難易度っぽいので、以下エントリのコードをお借りして動く…