【网络爬虫】1:正则表达式匹配爬取糗事百科,并导入MongoDB
无人在意的开场白:网络爬虫的学习源于2017年4月份,是为了参加广东省第五届《泰迪杯》数据挖掘的比赛。虽然比赛成绩不怎么样,但是网络爬虫却成为了我课余研究的小课题。这篇利用正则表达式匹配爬取糗事百科,并将指定数据导入MongoDB数据库的代码是很久前完成的。今天无意又见,就留心为它们记录下,也与大家相互指导。 –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—-—-—-—-——-—-
原创
2018-01-11 22:07:14 ·
737 阅读 ·
0 评论