【Python学习笔记】利用Python爬取百度搜索结果

这篇Python学习笔记介绍了如何使用urllib, urllib2, 和BeautifulSoup库来抓取并解析百度搜索的页面内容。重点讲解了在处理中文关键字时的转码方法,以及如何构造请求URL并获取网页源码。" 130706495,7337247,ClickHouse实战:五大核心问题解析,"['数据库', 'sql', '数据分析', 'ClickHouse', '集群']
摘要由CSDN通过智能技术生成

首先是需要的库:

urllib,urllib2 ----- 构建访问请求

sys ----- Python标准库

beautifulsoup ----- 解析抓取结果

一、构建访问请求

Python中urllib.urlencode可以把key-value这样的键值对转换成a=1&b=2这样的格式,如:

from urllib import urlencode
data = {'ie':'utf-8', 'word':'test'}
print data
print urlencode(data)

百度搜索的关键字为中文时,传递中文参数给URL需要经过转码,urlencode可以对中文进行转码

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值