![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
【Python爬虫】
文章平均质量分 64
Root_Smile
这个作者很懒,什么都没留下…
展开
-
【Python爬虫】图片验证码的处理
什么是图片验证码?验证码(CAPTCHA)是"Completely Automated Public Turing test to tell Computers and HumansApart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。原创 2024-05-25 13:38:52 · 1850 阅读 · 1 评论 -
【Python爬虫】反爬的手段
猫眼电影:电影详情页数字为自定义字体。原创 2024-05-24 20:09:10 · 1449 阅读 · 0 评论 -
【Python爬虫】案例_斗鱼
要求:获取直播间标题、类型、主播、热度,并实现翻页。定位随着网站更新可能不会实现,请自行更改。声明:案例只用于学习,不得恶意使用。原创 2024-05-24 11:02:27 · 835 阅读 · 0 评论 -
【Python爬虫】Selenium使用
安装配置教程自行搜索所用驱动chromedriver应与chrome浏览器版本相对应笔者selenium所用版本为4.11.2,新旧版之间会有差别实例化driver对象后,driver对象有一些常用的属性和方法我们使用Selenium时会觉得浏览器加载很慢,这和它的页面加载策略有关。原创 2024-05-23 19:37:44 · 1842 阅读 · 0 评论 -
【Python爬虫】案例_百度贴吧
可完善的地方:save_data()方法,将数据保存为csv或xlsx文件。更改User-Agent,将其改为低版本的浏览器。运行后发现结果是0,因为内容被注释了。用正则表达式去掉注释。原创 2024-05-21 21:00:58 · 673 阅读 · 0 评论 -
【Python爬虫】案例_lagou(json练习)
【代码】【Python】案例_lagou(json练习)原创 2024-05-21 20:09:52 · 411 阅读 · 0 评论 -
【Python爬虫】案例_github模拟登录
【代码】【Python爬虫】案例_github模拟登录。原创 2024-05-21 20:02:56 · 1548 阅读 · 0 评论 -
【Python爬虫】基本操作
先定义3个字段,用fieldnames表示,然后将其传给DicWriter方法初始化一个字典写入对象,并将对象赋给writer变量。接着调用写入对象的writerheader方法先写入头信息,再调用writerow方法传入相应字典。使用:先定义几条数据,每条数据都是一个字典,然后将其组合成一个列表,赋值为data。接着使用pandas的DataFrame类新建了一个DataFrame对象,参数传入data,并把该对象赋值为df。我们要想爬取想要的内容,就要进行元素定位。原创 2024-03-09 16:38:57 · 1271 阅读 · 3 评论