爬虫
嗷嗷在进步
这个作者很懒,什么都没留下…
展开
-
python爬虫----pyquery选择器
使用pyquery选择器爬取豆瓣读书《未来简史》短评如下为部分评论:F12或者右键–审查元素,如图:pyquery使用心得:一层一层剥洋葱,即从上往下一层一层提取元素。使用方法:id--"#",如<div id="wrapper">,则为'div#wrapper'class--&am原创 2019-02-23 16:44:40 · 275 阅读 · 0 评论 -
python爬虫--使用正则表达式 or xpath爬取豆瓣读书评论
本菜鸟实践中发现,使用正则表达式爬取想要的内容真的是太香了—只需定位到你想爬取的内容及前后内容即可(此处有点绕,下面详细讲解)以豆瓣读书《恶意》为例(此处心疼豆瓣一秒钟,总是成为菜鸟们练手的第一选择):图片左侧为评论内容,右侧为检查元素爬取的内容为第一条评论:作为新手妈咪,在看到最终结局的时候很感慨。凶手体内毒液一般的恶意,也许就是源自当初母亲在生活中流露出来的偏见,应该也算是失败教育的受...原创 2018-12-04 23:01:08 · 970 阅读 · 0 评论 -
scrapy(ImportError: DLL load faile:找不到指定的程序)解决办法
今天使用scrapy(scrapy startproject xxx)时遇到这种情况: from cryptography. hazmat. bindings._ openssl import ffi, libImportError: DLL load faile:找不到指定的程序解决办法(亲测):卸载scrapy(pip uninstall scrapy和conda remov...原创 2019-03-05 20:46:52 · 5173 阅读 · 1 评论