搜索引擎关键词抓取 以百度为例 python

上周晚上看了下一个高手利用python抓取搜索引擎的关键词提取的视频,自己动手也下了下,能实现简单的工作,分享给你们:
#coding:utf-8
'''
Created on 2015年9月6日
@author: Administrator
'''
import urllib2
import urllib
import re
import time
from  random  import   choice
iplist=['202.194.101.150','124.240.187.89','124.240.187.89']
ip=choice(iplist)
gic="众筹"
gjc=urllib.quote(gic)
url="https://sp0.baidu.com/5a1Fazu8AA54nxGko9WTAnF6hhy/su?wd="+str(gjc)
headers={"Get":url,
      "Host":"sp0.baidu.com",
      "Referer":"https://www.baidu.com/",
"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.89 Safari/537.36"

}
proxy_support=urllib2.ProxyHandler({'http':'http://'+ip}) #代理
opener=urllib2.build_opener(proxy_support) #代理
urllib2.install_opener(opener)   #代理

req=urllib2.Request(url)
for key  in headers:
    req.add_header(key, headers[key])
html=urllib2.urlopen(req).read()
html_decode=html.decode("gbk")
time.sleep(0.2)
result=re.findall(""(.*?)"",html_decode)
for  item  in result:
    print item

不懂的联系我  714947298
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值