![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 92
大大毛丶aj
'JavaScript'.split('').forEach((item, index)=> console.log(item))
展开
-
Python3.6使用requests进行网页(Web)爬虫之批量下载图片
前段时间发现了超清图片的网站,然后闲着没事干就写了个爬虫,进行批量下载,拿来当壁纸切换,个人觉得很不错的,然后就开干…解析网页用的lmxl,这个一般需要手动先安装,中文注释是后来加的,方便大家学习理解,下面是我的源代码,其中很多变量命名我都一直遵循规范来的#!/usr/bin/env python3.6# -*-coding = 'utf-8'-*-# @Time: 2020/2/28 ...原创 2020-03-09 13:27:15 · 710 阅读 · 0 评论 -
爬取 goubanjia 网站的免费 ip 免费 proxy JavaScript + Python + selenium
url: http://www.goubanjia.com/分析页面:根据结构,不难想象这是一个表格,如果通过页面去获取数据应该不难,但是通过检查发现,并不是想象中的那样(div, span, p层次不齐)第一个没有多余的字符,好像可以直接获取,但是再看第二个会发现,中间掺杂一些其他的标签,以及无用的信息,也许看到这里,新手这就犯难了,不要急,接下来继续.我的解决方法是使用js,简单粗暴(你可尝试在控制台输入以下代码,可以直接打印出来)通过css定位是表示 .ipip = docum原创 2020-08-13 18:33:29 · 9269 阅读 · 2 评论