2009年9月21日月曜日

[.NET]文字クラス

入力のチェックに、しばしば正規表現を使うことがあります。簡単なものからそうでないものまでいろいろあります。で、.NETでは、文字クラスというものが用意されております。なんでも「入力文字列と照合する文字のセット」だそうで。たとえば、いかのようなものがあります。
  • ひらがな→IsHiragana(3040-309F)
  • カタカナ→IsKatakana(30A0-30FF)
  • 漢字→IsCJKUnifiedIdeographs(4E00-9FFF)

で、たとえば、一文字以上の漢字であれば「^\p{IsCJKUnifiedIdeographs}+$」でいけるようです。こまかな話はよくわかりませんが、Unicode 4.0 および Perl 5.6 に基づいているようです。

0 件のコメント: