![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python爬虫学习笔记
文章平均质量分 51
旋转小马
这个作者很懒,什么都没留下…
展开
-
jupyter notebook 报错信息 ModuleNotFoundError: No module named jupyter_nbextensions_configurator
问题描述平台:windows 10专业版, anaconda3在启动jupyter notebook时,有报错信息,如下:ModuleNotFoundError: No module named jupyter_nbextensions_configurator虽然,jupyter lab 打开还能继续用,但出现报错信息始终是个隐患,于是经过查找资料,找到了以下解决方案解决办法python -m pip install --user jupyter_contrib_nbexte..原创 2021-12-16 12:48:00 · 6011 阅读 · 4 评论 -
python爬虫之以腾讯招聘为例,爬取动态页面
以腾讯招聘网站为例,打开网站,搜索“python”,返回页面如下:把鼠标光标放在我们要查询的岗位上,然后右键--->检查,点击network,然后刷新,其中XHR返回的便都是动态链接,其中不同于以往的网站,我们所要查找的数据不在response中,而是存放在preview中,如下图:此时再查看齐请求链接,链接较长,其中有很多的参数,具体的参数都存放在Query String Parameters中,如下:其中,timestamp为时间戳,10位表示秒(1970年1月1日 0时0..原创 2021-11-24 00:57:40 · 1826 阅读 · 0 评论 -
python爬虫之利用pyquery爬取当当网图书信息
初学爬虫, 根据课程学习python爬虫,老规矩,先不管三七二十几,先敲了再说。需求:爬取图书的图片链接、图书的title信息、当前定价、评论数和评价星数共五部分信息。分析:打开当当,搜索python书籍,然后右键,检查网页元素,找到network,然后刷新整个页面,就会返回请求的页面数据,找到左边的红框内的请求链接,然后打开右边的response模块,检查下面返回的内容是否有我们需要的信息,发现没问题,就可以继续往下进行。寻找图片:把鼠标放在网页的图片上直接右键,然后...原创 2021-11-19 16:49:40 · 5579 阅读 · 1 评论