python script爬虫_人肉python脚本爬虫

最新推荐文章于 2022-12-07 19:56:11 发布

weixin_39540704

最新推荐文章于 2022-12-07 19:56:11 发布

阅读量934

点赞数

文章标签： python script爬虫

看了几天的python,发现python的语法确实简单。今天了解了一下python写爬虫，在这里记录一下。

首先我们要下载pycharm

然后新建工程

第一种办法

目录如上 rexx.py 是使用正则表达式的方法 meizi.py是使用BeautifulSoup 三方库来实现解析jpg图片链接(早就听说python的第三库多且牛)

正则表达式我在这就不多描述代码如下

首先里面用到了requests 这个库。同理我们用时pip install requests安装

source.txt 是我们把网页源码复制到txt里面解析的(人肉就是手动操作哈哈！后面会介绍不用自己复制粘贴源码的操作)

解析完txt文件使用正则表达式匹配出我们的图片最终把他写入文件就可以了

第二种办法

在meizi.py文件里面代码如下

这里用到了自带的类库 urllib2 以及BeautifulSoup

当然我们可以把代码复制到txt解析然后处理但是现在我们现在直接urlopen一个链接

然后使用BeautifulSoup 处理拿到soup

使用soup.findall 就可以解析到想到的数据

BeautifulSoup 的功能比较多大家可以自己百度一下

这是我随便爬的图片好玩弄的我这只是做个备注可能有点乱有时间会整理下思路，大家随便看看就好。

weixin_39540704

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python script爬虫_人肉python脚本爬虫

看了几天的python,发现python的语法确实简单。今天了解了一下python写爬虫，在这里记录一下。首先我们要下载pycharm然后新建工程第一种办法目录如上 rexx.py 是使用正则表达式的方法 meizi.py是使用BeautifulSoup 三方库来实现解析jpg图片链接(早就听说python的第三库多且牛)正则表达式我在这就不多描述代码如下首先里面用到了requests 这个库...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。