一个正则表达式的问题: 怎样用正则表示:一个汉字或一个单词

2024年12月10日 21:25
有5个网友回答
网友(1):

[u4e00-u9fa5]不匹配汉字
[\u4e00-\u9fa5]这个匹配汉字

\w 不同的语言含义不同,通用的解释是表示单词字符。
javascript 只能包含英文数字和下划线
而在C#中还包含汉字,韩文等

网友(2):

如果是GB码,可能是双字节GBK[0x81-0xfe][0x40-0xfe],也可能是四字节GB18030[0x81-0xfe][0x30-0x39][0x81-0xfe][0x30-0x39]。
汉字在Unicode中称作CJK 统一表意符号 (CJK Unified Ideographs),包括
reg=/^([\u+3400-\u+4dbf\u4e00-\u9fff\u+20000-\u3fffd\ue000-f8ff]{2,7})$/; //只能是中文,长度为2-7字
最后一项为PUA,参见百度百科【统一码】。

网友(3):

没错,正则表达式里不能随便加空格的。如果加的话需要给正则加参数extended,这个参数在不同的语言里有不同的写法

网友(4):

貌似你补充的也是错的数字可以输入,字符也可以输入

网友(5):