用python爬取某个词条的源代码

最新推荐文章于 2022-12-08 16:58:33 发布

super选择题

最新推荐文章于 2022-12-08 16:58:33 发布

阅读量621

点赞数 1

分类专栏： python 文章标签：用python爬取某个词条的源代码用python爬取源代码

本文链接：https://blog.csdn.net/superxzt/article/details/84723720

版权

python 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

简单例子：在百度中输入关键词，并爬取该网页的源代码

#-*- coding:utf-8-*-
import urllib      #负责url编码处理
import urllib2

url = "http://www.baidu.com/s"
word = {"wd":"冼焯庭"}
word = urllib.urlencode(word) #转换成url编码格式（字符串）
newurl = url + "?" + word    # url首个分隔符就是 ?

headers={ "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.103 Safari/537.36"}

request = urllib2.Request(newurl, headers=headers)

response = urllib2.urlopen(request)
print response.read()