menu

秋梦无痕

一场秋雨无梦痕,春夜清风冻煞人。冬来冷水寒似铁,夏至京北蟑满城。

Avatar

查找中文的正则表达式

from: 那谁的技术博客

(".*[\u4E00-\u9FA5]+)|([\u4E00-\u9FA5]+.*")

在Visual Studio/Flash Builder中测试通过。

这个 Blog 的评论部分客户端验证也用到了中文检测,不过貌似范围不同:


if(/[^\u4E00-\u9FA0a-zA-Z0-9._ ]/.test(author_name)) {
	alert("名字中不能含有除中文、字母、数字、句点及下划线之外的字符!");
	return;
}

关于unicode集合中的汉字,若干子区间如下定义:
03007 1 汉字“〇”
03400~04DB5 6582 ExtA 连续
04E00~09FCB 20940 基本集 连续,但9FBC~9FCB暂无字形
0E815~0E864 80 自定义区 连续,这些字符有两个unicode编码
0F900~0FAD9 470 兼容集 有洞,且[FA2E,FA2F,FA6E,FA6F]暂无字形
20000~2A6D6 42711 ExtB 连续
2F800~2FA1D 542 兼容补遗 连续
2A700~2B734 4149 ExtC 连续
2B740~2B81D 222 ExtD 连续