如何统计html标签的数目 python

时间:2026-02-14 09:21:41

1、准备一个要统计的html文件,将其与py代码放在同一目录中

2、编写代码:

import re


with open('index.html','r',encoding='utf-8') as f:
   htmlstr = f.read()      # 打开html文件,并将内容放入htmstr变量
elements_lists = re.findall('<[^/].*?>',htmlstr)    # 利用正则表达式,查找所有不是以/开头的<>
print(len(elements_lists))      # 打印其长度
print(len(list(set(elements_lists))))   # 去重后打印长度

3、上述代码的缺点是:如果正文中有<内容>这样的情况,那也会一并被统计。

© 2026 一点知道
信息来自网络 所有数据仅供参考
有疑问请联系站长 site.kefu@gmail.com