爬虫
冯晔_0402
这个作者很懒,什么都没留下…
展开
-
【小练习】使用selenium根据 歌单 多线程爬取网易云音乐的歌词
准备工作首先找到url,分析页面:通过分析发现直接用find_element_by_XXX的方法是提取不到内容的,首先要转换到iframe这个页面中,代码如下:import timefrom docx import Documentfrom selenium import webdriverfrom multiprocessing import Process, Queuedocument = Document()driver = webdriver.Chrome(r'D:\电脑软件\c原创 2020-05-09 18:06:06 · 509 阅读 · 0 评论 -
Chrome driver的下载与安装
下载因为国外的google得科学上网,可以用淘宝提供的镜像:点击进入选择版本如果是比较老的版本可以查看自己浏览器对应的版本号,如果像我一样比较新直接在下面找自己对应的版本号就可以了:使用下载好之后解压:我用的selenium,直接传入文件绝对路径,创建对象就可以开始愉快的使用了:...原创 2020-04-16 20:19:07 · 256 阅读 · 0 评论 -
爬虫基础入门——Requests轻松上手!
前言目前自己在学习爬虫,故开始写博客来记录自己的学习心得并且顺便把自己的所学分享给各位想要学习爬虫的朋友。Request是什么?request是python中用于发送网络请求的库,底层基于urllib库,我们可以用它来模拟浏览器向网站服务器发送请求,从而拿到我们想要的数据内容,然后就可以对数据进行提取,得到我们想要的内容了。爬虫流程request做的就是第二、第三步。Requests...原创 2020-04-10 18:05:09 · 254 阅读 · 0 评论