现在的位置: 网页制作教程网站制作教程 >正文
JavaScript脚本

正则表达式获取html中指定标签内容的方法

发表于2020/9/3 网站制作教程 0条评论 ⁄ 热度 3,568℃

如果我们获取了一段html标签内容,但只想取其中指定的内容,这时候用正则表达式实现无非是最便捷的途径。但很多小伙伴并不知道如何用正则表达式获取html标签指定的内容,因为正则表达式太抽象了。本篇教程就结合示例,给大家讲解正则表达式获取标签内容的方法。

首先,我们给出一段html代码:

<html>
  <head>
    <title>正则表达式获取html指定内容示例代码</title>
  </head>
  <body>
    <table>
      <tr>
        <td><a href="内容1" target="_blank">内容2</a></td>
        <td><a class="bl" href="https://www.ae256.com/vr/209111501541747.html">内容3</a><div class="f10">内容4</div></td>
        <td>航拍澳门妈祖像跨海大桥电视塔城市建筑视频</td>
      </tr>
    </table>
  </body>
</html>

我们现在希望通过正则表达式获取到html代码中的内容1、内容2、内容3、内容4,这四处内容,那如何写正则表达式吗?

string str12="<a href=\"内容1\" target=_blank>内容2</a>";
string pattern12 = "<a\\shref=\"([^\"]*)\"\\starget=_blank>(.*?)</a>";
var m = Regex.Match(str12, pattern12, RegexOptions.Singleline | RegexOptions.IgnoreCase);
string bs1 = m.Groups[1].Value;
string bs2 = m.Groups[2].Value;

string str3 = "<a class=bl href=\"https://www.ae256.com/vr/209111501541747.html\">内容3</a>";
string pattern3 = "<a\\sclass=bl[^<]*>(.*?)</a>";
m = Regex.Match(str3, pattern3, RegexOptions.Singleline | RegexOptions.IgnoreCase);
string bs3 = m.Groups[1].Value;
  
string str4 = "<div class=f10>内容4</div>";
string pattern4 = "<div\\sclass=f10[^<]*>(.*?)</div>";
m = Regex.Match(str4, pattern4, RegexOptions.Singleline | RegexOptions.IgnoreCase);
string bs4 = m.Groups[1].Value;
  • 暂无评论