如果我们获取了一段html标签内容,但只想取其中指定的内容,这时候用正则表达式实现无非是最便捷的途径。但很多小伙伴并不知道如何用正则表达式获取html标签指定的内容,因为正则表达式太抽象了。本篇教程就结合示例,给大家讲解正则表达式获取标签内容的方法。
首先,我们给出一段html代码:
<html> <head> <title>正则表达式获取html指定内容示例代码</title> </head> <body> <table> <tr> <td><a href="内容1" target="_blank">内容2</a></td> <td><a class="bl" href="https://www.ae256.com/vr/209111501541747.html">内容3</a><div class="f10">内容4</div></td> <td>航拍澳门妈祖像跨海大桥电视塔城市建筑视频</td> </tr> </table> </body> </html>
我们现在希望通过正则表达式获取到html代码中的内容1、内容2、内容3、内容4,这四处内容,那如何写正则表达式吗?
string str12="<a href=\"内容1\" target=_blank>内容2</a>"; string pattern12 = "<a\\shref=\"([^\"]*)\"\\starget=_blank>(.*?)</a>"; var m = Regex.Match(str12, pattern12, RegexOptions.Singleline | RegexOptions.IgnoreCase); string bs1 = m.Groups[1].Value; string bs2 = m.Groups[2].Value; string str3 = "<a class=bl href=\"https://www.ae256.com/vr/209111501541747.html\">内容3</a>"; string pattern3 = "<a\\sclass=bl[^<]*>(.*?)</a>"; m = Regex.Match(str3, pattern3, RegexOptions.Singleline | RegexOptions.IgnoreCase); string bs3 = m.Groups[1].Value; string str4 = "<div class=f10>内容4</div>"; string pattern4 = "<div\\sclass=f10[^<]*>(.*?)</div>"; m = Regex.Match(str4, pattern4, RegexOptions.Singleline | RegexOptions.IgnoreCase); string bs4 = m.Groups[1].Value;
声明:如需转载,请注明来源于www.webym.net并保留原文链接:http://www.webym.net/jiaocheng/1109.html