全角ハイフンの履歴

で、元のテキストファイルの全角ハイフンを「od -t x1」
で見てみると「ef bc 8d」と「e2 88 92」の2種類が混じっていました。
前者は「\p{Hyphen}」にマッチするのですが後者はダメ。
まあ原因は分かったので、前処理でバイナリ置換して解決しました。

http://chalow.net/2008-05-01-3.html