#!/usr/bin/env python
#-*- coding: utf8 -*-
import re
html = """
白天
多云
14℃
夜间
多云
6℃
"""
if __name__ == '__main__':
p = re.compile(']+>')
print p.sub("", html)
这个是去掉所有HTML标签。你可以把你需要提取数据的那行HTML用这个正则把非HTML标签的内容提取出来
例如:
取天气
#!/usr/bin/env python
#-*- coding: utf8 -*-
import re
html = """
多云
"""
if __name__ == '__main__':
p = re.compile(']+>')
print p.sub("", html)
取温度
#!/usr/bin/env python
#-*- coding: utf8 -*-
import re
html = """
14℃
"""
if __name__ == '__main__':
p = re.compile(']+>')
print p.sub("", html)