文章を単語群へ。「Yahoo!日本語形態素解析API」
ベイジアンフィルターを利用する場合に形態素解析(意味のある最小単位の単語へ分割すること)が必要であったので、Yahoo!の日本語形態素解析ツールを使用してみた。凄い簡単に使える。 例えば「アインシュタインは26歳の時に相対性理論を発表した。」という文を解析すると以下のように解析してくれる。
使い方を簡単にメモしておく。
Yahoo!アカウント取得
形態素解析APIを使用するためにはYahoo!アカウントが必要となる。Yahoo!アカウントを保持していない場合にはこちらから取得する。アプリケーションID取得
Yahoo!にログイン後、アプリケーション管理ページにアクセスし、アプリケーションIDを取得する。簡単に入力内容について以下記載したのでご参考いただければ幸い。- 【WebAPIを利用する場所】
- 【アプリケーションの基本情報】
- 【ガイドラインを確認する】
- 【確認ページ】に遷移




実際に形態素解析
登録するとアプリケーションIDをが表示されるので、そのIDをキープしておく。 IDが取得できれば形態素解析を実施するのは簡単。 以下のURL定型文に当てはめ、httpアクセスを行えば形態素解析した結果を取得できる。 ※テストであればブラウザからアクセスしてみると良い。なお、アプリケーションIDは最後の「-」もIDの一部なので含めること。
定型文 | https://jlp.yahooapis.jp/MAService/V1/parse?appid=【取得したアプリケーションID】&results=ma,uniq&uniq_filter=9%7C10&sentence=【解析したい文章】 |
---|---|
例 | https://jlp.yahooapis.jp/MAService/V1/parse?appid=【取得したアプリケーションID】&results=ma,uniq&uniq_filter=9%7C10&sentence=アインシュタインは26歳の時に相対性理論を発表した。 |
※appid(アプリケーションID),results(解析結果の種類),sentence(解析対象のテキスト)という3つの要素は必須要素であり、その他にも追加できるパラメータがある。それに関してはここを参考に。phpのサンプルコードなども記載されている。