HTML::ExtractContentの履歴

はてブで使われてる文抽出ライブラリ
http://d.hatena.ne.jp/tarao/20090322#1237750634

文っぽい、文っぽくないでスコアリングするヒューリスティクアルゴリズム