由于党员每月都要开党员活动主题会议,还要写会议体会很是麻烦,所以特地新学python爬取人民日报抓取主题关键字,断断续续忙了2天多,还是挺有意思的,Python真的超级强大,语法和其他语言比较像,大致了解一下就可以上手了~~
工具:python3.6、bs4、requests、pyinstaller
代码写的很白痴,仅供自己使用。
import requests
import os
import calendar
from bs4 import BeautifulSoup
key = input('请输入要爬的关键字:')
monthstr = input('请输入2018年起始月:')
daystr = input('请输入2018年起始日:')
monthend = input('请输入2018年终止月:')
dayend = input('请输入2018年终止日:')
print("开始搜索2018年"+monthstr+"月"+daystr+"日至2018年"+monthend+"月"+dayend+"日关于“"+key+"”的数据信息...")
Hhttpfront= "http://paper.people.com.cn/rmrb/html/2018-"
Hhttpend="/nbs.D110000renmrb_01.htm"
Hhttpmi=""
print("文件存储地址为:"+os.getcwd())
for i in range(int(monthstr),int(monthend)+1):