python爬取K站图片

最新推荐文章于 2021-08-24 01:11:40 发布

coolsunxu

最新推荐文章于 2021-08-24 01:11:40 发布

阅读量2.1k

点赞数 1

分类专栏： Python 文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/coolsunxu/article/details/80948415

版权

Python 专栏收录该内容

55 篇文章 2 订阅

订阅专栏

#coding:utf-8

from lxml import etree
import requests


header={
	'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)'+
	'Chrome/67.0.3396.87 Safari/537.36'
}

urls=['http://konachan.com/post?page={}&tags='.format(str(i))
		for i in range(1,2)]
path='E://K/'

for url in urls :
	res=requests.get(url)
	selector=etree.HTML(res.text)
	second_urls=selector.xpath('//ul[@id="post-list-posts"]/li')
	
	for second_url in second_urls:
		second_url_nums=second_url.xpath('div/a')
		for second_url_num in second_url_nums :
			new_url = second_url_num.xpath('@href')[0]
			new_url='http://konachan.com'+str(new_url)
			new_res=requests.get(new_url)
			new_selector=etree.HTML(new_res.text)
			new_second_urls=new_selector.xpath('//*[@id="image"]')
			img_src = new_second_urls[0].xpath('@src')[0]
			data=requests.get(img_src,headers=header)
			fp=open(path+new_url.split('/')[-1]+'.'+img_src.split('.')[-1],'wb')
			fp.write(data.content)
			fp.close()

可以设置页数，range(m,n)

可以修改路径path,运行时需要首先建好文件夹，例如E://K/

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

coolsunxu CSDN认证博客专家 CSDN认证企业博客

码龄9年

988: 原创

2万+: 周排名

178万+: 总排名

105万+: 访问

: 等级

1万+: 积分

390: 粉丝

620: 获赞

310: 评论

2151: 收藏

私信

关注

热门文章

分类专栏

mongodb 1篇
Akka 1篇
Erlang 1篇
mysql 1篇
kafka 1篇
牛客网 209篇
LintCode 62篇
C 67篇
Deep learning 4篇
Pytorch 8篇
PHP 2篇
Tensorflow 19篇
C++ 735篇
汇编 12篇
算法导论 20篇
Java 21篇
HTML 3篇
Python 55篇
网络通信 2篇
Matlab 21篇
OpenCV 7篇
GO 20篇
Verilog 29篇
CPU 24篇
OpenACC 1篇
Windows 2篇
JavaScript 25篇
Reinforcement learning 12篇
LeetCode 459篇
CodeWars 27篇

最新评论

C++编写分形问题
落雁栖: pow(3,n-1)为什么是3啊？
图的深度遍历(邻接表)
2401_84437198: 这个有输出实例吗
C++编写分形问题
sy09120103: 就是因为由大化小时，边长也应该减小一个次方啊
GraphTCN: Spatio-Temporal Interaction Modeling for Human Trajectory Prediction
weixin_48349763: 作者你好，请问一下原文中的损失函数是怎么实现的，就是那个多条轨迹选误差最小的那个损失函数
GraphTCN: Spatio-Temporal Interaction Modeling for Human Trajectory Prediction
weixin_48349763: 作者你好，请问一下原论文中的初始邻接矩阵是在那一段代码中实现的，就是利用相对距离得到的那个邻接矩阵

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。