全角ハイフン

1pt

で、元のテキストファイルの全角ハイフンを「od -t x1」
で見てみると「ef bc 8d」と「e2 88 92」の2種類が混じっていました。
前者は「\p{Hyphen}」にマッチするのですが後者はダメ。
まあ原因は分かったので、前処理でバイナリ置換して解決しました。

http://chalow.net/2008-05-01-3.html


DAN KOGAIは、

後者はハイフンでなくてマイナス記号でんがな。

http://blog.livedoor.jp/dankogai/archives/51043693.html


とのことなんだけれども、実際には電話番号の区切り文字として入力されることがあるんだよね。なので、こいつも一緒に、

$string =~ s/\x{2212}/-/;


と置換した。

「全角ハイフン」について友人に書いてもらう。

あなたにとって「全角ハイフン」とは?

ログインするとワンクリックでキーワードを投稿できます

ログインする 新規登録する

関連したキーワードを持つお気に入り

他の人の「全角ハイフン」を見る