简要说明:
现有一份课堂的学生名单excel文件,根据学生名单对QQ群中的成员进行统计,找出【在名单中的同学】与【不在名单中的同学】。
思路:
将网页中某一部分元素copy出来,进行xml分析。
要求:
1、Excel文件第C列为学生姓名。
2、QQ群内所有人的名字格式都是:【姓名-班级】或【姓名】或【空】。
具体步骤:
新建文件input.html,将上图框出的代码copy到input.html文件中。
运行程序test.py进行分析,代码如下:
######################################################################
#
# 使用方法:
# 1、人工确保所有名字格式严格正确(“姓名”或者“姓名-班级”)。
# 2、将qq群成员管理网页html中的table元素copy到input.html中。
# 3、运行程序。
#
######################################################################
from lxml import etree
import xlrd
lines = open('input.html', encoding='utf-8').readlines()
html=''
for line in lines:
html += line;
page = etree.HTML