python爬虫如何获得所有网站,这个方法真的很好用诶。

VIP文章怪小六

已于 2022-07-09 13:30:15 修改

阅读量2.1k

点赞数

分类专栏： python 文章标签： python 爬虫开发语言

于 2022-07-09 10:02:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_66903902/article/details/125689259

版权

通常我们需要在网站中搜索得到我们需要的信息，这里分为二种情况：

第一种直接改变网址就可以得到你想要搜索的页面：

def GetWebPage( x ): #我们定义一个获取页面的函数，x 是用于呈递你在页面中搜索的内容的参数
url = ‘http://xxxxx/xxx.cgi?&’ + ‘你想要搜索的参数’ # 结合自己页面情况适当修改
page = urllib2.urlopen(url)
pageContent = page.read( )
return pageContent #返回的是HTML格式的页面信息在这里插入图片描述

第二种 post方法，将你搜索的内容放在postdata里面，然后返回你需要的页面

def GetWebPage( x ): #我们定义一个获取页面的函数，x 是用于呈递你在页面中搜索的内容的参数 url =
‘http://xxxxx/xxx’ #这个网址是你进入搜索界面的网址

postData = urllib.urlencode( { 各种‘post’参数输入 } ) #这里面的post参数输入需要自己去查
req= urllib2.Request (url, postData)

pageContent = urllib2.urlopen (req). read( )

return pageContent #返回的是HTML格式的页面信息

在获取了我们需要的网页信息之后，我们需要从获得的网页中进一步获取我们需要的信息，这里我推荐使用 Bea

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python爬虫如何获得所有网站,这个方法真的很好用诶。

通常我们需要在网站中搜索得到我们需要的信息，这里分为二种情况：def GetWebPage( x ): #我们定义一个获取页面的函数，x 是用于呈递你在页面中搜索的内容的参数url = ‘http://xxxxx/xxx.cgi?&’ + ‘你想要搜索的参数’ # 结合自己页面情况适当修改page = urllib2.urlopen(url)pageContent = page.read( )return pageContent #返回的是HTML格式的页面信息def GetWebPage( x )
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。