DELPHIER

プログラミングを中心にした思いつきの書きとめ場所です。

2005年05月10日

Webページに含まれる単語を列挙すると何が分かるのか?

日本の方が作られているソフトウェアに、単語を抽出できるソフトウェアがあります。
MeCab、ChaSen、kakasiなどです。

これを使えば、Webページに含まれている単語を列挙することができそうです。
単語を列挙すれば、頻度、総単語数が分かります。
・・・思いつきませんが、いろいろと面白い使い方が出来るんじゃないか、と考えています。
[続きを読む..]

256855 Since 2005-05-01