此正则表达式收集于网络,但那个网站连复制一下都需要注册会员,鄙视之,所以不提他了。而且,原作者也不可能是那个网站。 html标签有<h1></h1>这种成对的,也有<br/>这种自闭合的,更多的是<img style=”….” width=”22″ />这种混合了很多字符的。那要怎么把他们都匹配呢? 其实匹配html标签的正则表达式很短,如下:
<[^>]+>
就这样,没了?是的。你惊讶吗? 虽然叫我写我写不出来,但这个正则表达式我却能看懂。首先,html标签肯定是以<符号开始的,以>符号结束(不管是不是自闭合),只是中间有点纠结,可能有字符,数字,引号,换行符——但是,却万万没有>,因为有它的话html标签就结束了,所以正则表达式中间是[^>]+,表示“除了>符号外的任何1个以上的字符”。 在notepad++中测试,使用以上正则表达式,成功替换所有html标签。嘿嘿,很有用。 |