python爬取2020国家科学技术奖励网站(正则表达式)调用docx转存word
因网站部分网页源码不够规范,所以选择正则表达式代替bs4,有同样需求的朋友可以看一哈~这里放上全部代码,但注释较少,有问题可以评论交流。# -*- coding: utf-8 -*-import urllib.requestimport reimport osfrom docx import Documentfrom docx.shared import Inchesfrom do...
原创
2020-03-26 16:12:46 ·
3725 阅读 ·
6 评论