python网络爬虫入门小程序_Python 实现网络爬虫小程序

最新推荐文章于 2024-03-24 15:29:25 发布

weixin_39633452

最新推荐文章于 2024-03-24 15:29:25 发布

阅读量308

点赞数

文章标签： python网络爬虫入门小程序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39633452/article/details/111458081

版权

转载请注明作者和出处： http://blog.csdn.net/c406495762 运行平台： Windows Python版本： Python3.x IDE： Sublime text3 前言问题分析预备知识 1 Selenium 11 简介 12 安装 13 基础知识 131 小试牛刀 132 模拟提交 133 元素选取 134 界面交互 135 添加U

Python很简洁，也很强大，作为兴趣，值得一学！

下面这个程序实现的是从一个网站上下载图片，根据自己需要可以进行修改使用Python语言，编写简单的爬虫程序，在百度百科页面上爬取跟词条“Python”有关的1000个页面(页面数目可以自己任意设定)。这个简易的爬虫项目可以分为5个模块：首先，需要有一个程序入口spider_main，同时作为爬虫的总控程序(调度程序)，改程序需要

import re

import urllib

def gethtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getimg(html):

reg = r'src="(.*?\.jpg)"'

imgre = re.compile(reg)

imglist = re.findall(imgre, html)

x = 1

for imgurl in imglist:

urllib.urlretrieve(imgurl, '%s.jpg' % x)

x+=1

target = raw_input("Input one url:")

html = gethtml(target)

print "please wating, pictrues are downloading....."

getimg(html)

weixin_39633452

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python网络爬虫入门小程序_Python 实现网络爬虫小程序

转载请注明作者和出处： http://blog.csdn.net/c406495762 运行平台： Windows Python版本： Python3.x IDE： Sublime text3 前言问题分析预备知识 1 Selenium 11 简介 12 安装 13 基础知识 131 小试牛刀 132 模拟提交 133 元素选取 134 界面交互 135 添加UPython很简洁，也很强大，作...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。