pythonの鉴黄之路（四）——urllib模块批量下载

最新推荐文章于 2024-08-07 07:37:36 发布

九日王朝

最新推荐文章于 2024-08-07 07:37:36 发布

阅读量1.6k

点赞数 2

分类专栏： python 文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sm9sun/article/details/53322325

版权

python 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

好了，现在鉴黄的demo可以跑通了，就差大量的数据了（就是黄图）

这可难倒了纯洁的宝宝。

本宝宝表示找了好几天都找不到一张黄图

后来问了一些老司机，得到了一些资♂源♂丰♂富♂的网址

不过本宝宝还是不好意思打开~就只能写一个小爬虫批量下载了-.-

其实就是用python的urllib完成打开、下载等操作，直接简单的匹配该后缀jpg的就好了

#coding=utf-8
import urllib
import re

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1
    return 'OK!'


html = getHtml("某些资♂源♂丰♂富♂的网站")

print getImg(html)

效果还是蛮不错的~~

好了不说了，我要去测（yong）试（zhi）了

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

九日王朝

CSDN认证博客专家 CSDN认证企业博客

码龄8年

268: 原创

1万+: 周排名

97万+: 总排名

90万+: 访问

: 等级

1万+: 积分

1058: 粉丝

609: 获赞

215: 评论

1173: 收藏

私信

关注

热门文章

分类专栏

周易 66篇
人工智障 29篇
xxl-job 1篇
系统性能 2篇
Elasticsearch 5篇
app推广开发 2篇
ACM 73篇
游戏算法 30篇
图像算法 4篇
C/C++ 49篇
python 23篇
node.js 17篇
lua 8篇
c#.net 1篇
VB.net 1篇
BrainFuck 1篇
redis 5篇
OAuth2.0 2篇
Tesseract-OCR 1篇
protobuf 1篇
ffmpeg 1篇
AviSynth 2篇
区块链 1篇
转载 1篇
杂谈 6篇

最新评论

十亿次实验，用概率解读周易大衍筮法的奥秘
weixin_41393877: 当你带入了正态分布离散化，你会发现只有乾坤而卦概率相差很大（相差最大2.5倍），但是互为综卦的出现概率是相同的，且相差可以忽略掉。老阴6最少，少阴8最多，整体大约阳爻比阴爻比例是1 : 1.17。
十亿次实验，用概率解读周易大衍筮法的奥秘
weixin_41393877: 我一看你就是用了随机数来“分二”，如果采用随机数的话，6789中的6会明显降低。而如果你用正态分布的离散化处理这一场景，你会发现6虽然少，但基本上是均匀的。阴阳基本平衡，64卦出现的概率也是基本均匀的，但是也有去趋向性，但是绝没有相差那么大的情况，计算机的随机和正态分布离散化的随机还是有很大区别的，见（https://www.sblog.top/biji/3.html）
十亿次实验，用概率解读周易大衍筮法的奥秘
gonepoo: 你的蓍草概率和我实际挺像，但是除了第一次9/5的概率，9低一点，后两次4/8的概率不都是1/2吗
斗地主AI算法——第六章の牌型判断
NINESONGRL: 三带一只看三个的价值，不看单牌的价值吗
动态规划——雇佣员工（hdu1158）
2201_75321374: 这个可以画表吗，作者大大

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。