使用Editplus正则表达式整理数据
作者:我就是个世界
发表于:2012-10-19
Editplus是我最喜爱的,且从事IT以来一直使用的文本编辑器,它的小巧精悍且功能强大,启动和处理数据速度之快是我喜欢它的原因之一,当然它还有更强大的功能。
今天举个小小的例子说一下Editplus在整理数据时使用正则表达式的运用技巧。
例子,有以下数据:[separator]
[code]
<ul class="title_list fs_14">
<li><a style="cursor:pointer" onclick="goVideo('a1e006381a43407997918acd139bc2a3','VIDE1328584266909524')">《动物世界》 20120111</a></li>
<li><a style="cursor:pointer" onclick="goVideo('a87ea6aa39734cc788ee6569fe632886','VIDE1328584267055526')">《动物世界》 20120112</a></li>
<li><a style="cursor:pointer" onclick="goVideo('36199e1ad8d7445bbe2abcd0125c2f30','VIDE1328584267192528')">《动物世界》 20120113</a></li>
<li><a style="cursor:pointer" onclick="goVideo('78f923a2038e43cbb4d4279ad3f11ed9','VIDE1328584267327530')">《动物世界》 20120114</a></li>
<li><a style="cursor:pointer" onclick="goVideo('0d9e1407c35b464f9dbca19de6a42c63','VIDE1328584267462532')">《动物世界》 20120115</a></li>
<li><a style="cursor:pointer" onclick="goVideo('25b64350be55433a91440458db0de3f6','VIDE1328584267600534')">《动物世界》 20120116</a></li>
<li><a style="cursor:pointer" onclick="goVideo('d8f45055d7f049b48738f6066bdf8d61','VIDE1328584267740536')">《动物世界》 20120117</a></li>
<li><a style="cursor:pointer" onclick="goVideo('d9ae4b0e125d48c69263067640f8a90a','VIDE1328584267884538')">《动物世界》 20120118</a></li>
<li><a style="cursor:pointer" onclick="goVideo('bf5069b5b4e047358ffdcb0c3f5f59f8','VIDE1328584268023540')">《动物世界》 20120119</a></li>
<li><a style="cursor:pointer" onclick="goVideo('7fd5109f3d9e402db9df0e4295741810','VIDE1328584268167542')">《动物世界》 20120120</a></li>
</ul>
[/code]
需要整理为这样的格式:
[code]20120120$7fd5109f3d9e402db9df0e4295741810[/code]
[img][attach]427[/attach][/img]
我们先大致手工整理一下数据先删除掉顶部和底部的ul标签,然后(CTRL+A)全选,再按(CTRL+SHIFT+I)把所有行进行缩进。
[img][attach]428[/attach][/img]
下面开始使用正则表达式进行替换:
在Editplus中快捷键(CTRL+H)打开替换窗口,勾选Regular expression(正则表达式),点More(更多)打开正则替换窗口,上面输入[code]^[ \t]*\n[/code]下面留空,这一步删除空行,
[img][attach]429[/attach][/img]
然后直接替换我们想要的数据格式:
正则替换窗口,上面输入[code]^.*\(\'([a-zA-Z0-9\-]+).*》 ([0-9]+)</a></li>$[/code]下面输入[code]\2$\1[/code]然后点击Replace All(替换所有)
[img][attach]430[/attach][/img]
OK,就这样很简单我们要的数据得到了!
[img][attach]431[/attach][/img]
关于正则表达式大家可以先看一下这里:[url=http://www.husw.net/tool/Regular%20Expression/zhengzhe-biaodashi-jiaocheng-se.htm]正则表达式30分钟入门教程[/url]
今天举个小小的例子说一下Editplus在整理数据时使用正则表达式的运用技巧。
例子,有以下数据:[separator]
[code]
<ul class="title_list fs_14">
<li><a style="cursor:pointer" onclick="goVideo('a1e006381a43407997918acd139bc2a3','VIDE1328584266909524')">《动物世界》 20120111</a></li>
<li><a style="cursor:pointer" onclick="goVideo('a87ea6aa39734cc788ee6569fe632886','VIDE1328584267055526')">《动物世界》 20120112</a></li>
<li><a style="cursor:pointer" onclick="goVideo('36199e1ad8d7445bbe2abcd0125c2f30','VIDE1328584267192528')">《动物世界》 20120113</a></li>
<li><a style="cursor:pointer" onclick="goVideo('78f923a2038e43cbb4d4279ad3f11ed9','VIDE1328584267327530')">《动物世界》 20120114</a></li>
<li><a style="cursor:pointer" onclick="goVideo('0d9e1407c35b464f9dbca19de6a42c63','VIDE1328584267462532')">《动物世界》 20120115</a></li>
<li><a style="cursor:pointer" onclick="goVideo('25b64350be55433a91440458db0de3f6','VIDE1328584267600534')">《动物世界》 20120116</a></li>
<li><a style="cursor:pointer" onclick="goVideo('d8f45055d7f049b48738f6066bdf8d61','VIDE1328584267740536')">《动物世界》 20120117</a></li>
<li><a style="cursor:pointer" onclick="goVideo('d9ae4b0e125d48c69263067640f8a90a','VIDE1328584267884538')">《动物世界》 20120118</a></li>
<li><a style="cursor:pointer" onclick="goVideo('bf5069b5b4e047358ffdcb0c3f5f59f8','VIDE1328584268023540')">《动物世界》 20120119</a></li>
<li><a style="cursor:pointer" onclick="goVideo('7fd5109f3d9e402db9df0e4295741810','VIDE1328584268167542')">《动物世界》 20120120</a></li>
</ul>
[/code]
需要整理为这样的格式:
[code]20120120$7fd5109f3d9e402db9df0e4295741810[/code]
[img][attach]427[/attach][/img]
我们先大致手工整理一下数据先删除掉顶部和底部的ul标签,然后(CTRL+A)全选,再按(CTRL+SHIFT+I)把所有行进行缩进。
[img][attach]428[/attach][/img]
下面开始使用正则表达式进行替换:
在Editplus中快捷键(CTRL+H)打开替换窗口,勾选Regular expression(正则表达式),点More(更多)打开正则替换窗口,上面输入[code]^[ \t]*\n[/code]下面留空,这一步删除空行,
[img][attach]429[/attach][/img]
然后直接替换我们想要的数据格式:
正则替换窗口,上面输入[code]^.*\(\'([a-zA-Z0-9\-]+).*》 ([0-9]+)</a></li>$[/code]下面输入[code]\2$\1[/code]然后点击Replace All(替换所有)
[img][attach]430[/attach][/img]
OK,就这样很简单我们要的数据得到了!
[img][attach]431[/attach][/img]
关于正则表达式大家可以先看一下这里:[url=http://www.husw.net/tool/Regular%20Expression/zhengzhe-biaodashi-jiaocheng-se.htm]正则表达式30分钟入门教程[/url]
请发表您的评论