本文信息本文由方法SEO顾问发表于2015-06-2616:27:09,共 5458 字,转载请注明:Python挖词脚本,挖出几十万关键词不是梦 带搜索量_【方法SEO顾问】,如果我网站的文章对你有所帮助的话,来百度口碑给个好评呗!
前段时间在@方法的博客上看到一个数据接口,貌似是百度商情的关键词数据。
http://seofangfa.com/shell/baidukeyword-shangqing.html
在运行脚本之前,请确定你是否按照了MySQLdb库,安装方法可以去百度一下。
下面是我的代码。
#!/usr/local/bin/python
#coding:utf8
# 2015-6-26 DaoXin
import pycurl, json, MySQLdb
import StringIO
import urllib, urllib2
from random import choice
import sys
reload(sys)
sys.setdefaultencoding('utf8')
#useragent 列表,大家可以自行去收集。不过在本例中似乎不需要这个
AGENTS = [
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/43.0.2357.81 Safari/537.36",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/534.27 (KHTML, like Gecko) Chrome/12.0.712.0 Safari/534.27",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/13.0.782.24 Safari/535.1",
"Mozilla/5.0 (Windows NT 6.0) AppleWebKit/535.2 (KHTML, like Gecko) Chrome/15.0.874.120 Safari/535.2",
"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.7 (KHTML, like Gecko) Chrome/16.0.912.36 Safari/535.7",
"Mozilla/5.0 (Windows NT 6.1; WOW64; rv:2.0b4pre) Gecko/20100815 Minefield/4.0b4pre",
"Mozilla/5.0 (Windows; U; Windows NT 6.1; zh-CN) AppleWebKit/533.19.4 (KHTML, like Gecko) Version/5.0.2 Safari/533.18.5",
"Mozilla/5.0 (Windows; U; Windows NT 6.1; en-GB; rv:1.9.1.17) Gecko/20110123 (like Firefox/3.x) SeaMonkey/2.0.12"