category: Java
DATE : 2007/12/24 (Mon)
DATE : 2007/12/24 (Mon)
Java の java.util.regex.Pattern を用いると、正規表現を使用することができます。
正規表現を使って空白を区別するには、定義済みの文字クラスである「\s」を使用します。ところが、「\s」では半角スペースやタブ文字などは定義されていますが、全角スペースは定義されていません。
そこで、\p{javaWhitespace} を使います。この \p{javaWhitespace} は、Character.isWhitespace() の判定を行う文字クラスです。この判定基準のうち、Unicode の空白文字に全角スペース(IDEOGRAPHIC SPACE)が含まれているので、この文字クラスで半角スペースに加えて全角スペースも識別できます。なお、判定基準には Unicode の空白文字のほか、行区切り文字やタブ文字なども含まれているため、「\s」の代替として使えます。
参考文献
PR
忍者ブログ [PR]