为什么要做个关键词挖掘工具
最近做了个平台,需要做seo,然后要挖掘关键词,建立关键词库,然后根据关键词做优化.
网上找了一圈,大部分关键词感觉工具都是要收费的,也不能下载,一个个复制实在是麻烦.
要获得关键词,要么付费,要么一个个复制.
干脆自己动手,从网上采集。今天就来谈一谈如何使用Python采集站长工具(chinaz.com)关键词库。
从网上看了,相关的python源码,大部分都已经过期了,网址都不是那个了.所以也没啥参考价值
关键词挖掘主要功能
- 关键词挖掘相关提示信息
- 关键词获取,导出EXCEL
- 工具打包成python exe
界面截图
- 程序运行图
-关键词 导入Excel截图
-
源代码
import urllib.request as request
import lxml.html as html
import time
import requests
from lxml import etree
import xlwt
from pyquery import PyQuery as pq
def search_keyword(keyword):
a = 1
b = 0
xpath = '//ul[@class="Module-table-list clearfix"]'
data_list = []
while a <= 5:
url = 'https://data.chinaz.com/keyword/allindex/%s/%s' % (keyword,a)
print(url)
requests.packages.urllib3.disable_warnings()
data = requests.get(url,verify=False).text
dom = etree.HTML(data)
links = dom.xpath(xpath)
doc = pq(data)
ms = doc('.z-fl.fz14.lh32').text()
print(ms)
#count=dom.xpath('//div[@class="z-fl fz14 lh32"]/span[1]/text()')
#print(links)
tplt = "{0:{3}^2}\t{1:{3}^10}\t{2:^10}"
print(tplt.format("序号", "长尾词", "指数", chr(12288)))
for link in links:
num = link.xpath("./li[1]/text()")[0].strip()
word = link.xpath("./li[2]/a/text()")[0].strip()
zhishu = link.xpath("./li[3]/a/text()")[0].strip()
print(tplt.format(num,word,zhishu, chr(12288)))
data = [
num,
word,
zhishu,
]
data_list.append(data)
a += 1
time.sleep(3)
if(len(data_list)==0):
print("该关键词没有挖掘到关键词数据")
return
bcsj(keyword, data_list)
#保存关键词数据为excel格式
def bcsj(keyword,data):
workbook = xlwt.Workbook(encoding='utf-8')
booksheet = workbook.add_sheet('Sheet 1', cell_overwrite_ok=True)
title = [['序号', '长尾词', '指数']]
title.extend(data)
for i, row in enumerate(title):
for j, col in enumerate(row):
booksheet.write(i, j, col)
workbook.save(f'{keyword}.xls')
print(f"保存关键词数据为 {keyword}.xls 成功!")
if __name__ == '__main__':
keyword = input('请输入关键词>>')
print('正在查询,请稍后...')
search_keyword(keyword)
源代码毫无保留.谢谢给出指点意见.
这样一个免费的关键词挖掘工具做好了.
以上就是这里以采集站长工具为例,同样的还可以采集其他类似网站,比如爱站网、5118等,多个网站综合起来,采集的关键词将更多更全一些。
另外有些seo工具,类似域名挖掘,死链查询,自动伪原创.
本人长期从事python ,c#开发,需要工具,插件的可以找我,一起学习.
如果要使用此挖掘工具,不会Python 的人有一定的难度.
需要exe文件的可以在下面留言.
这样就可以一键使用