Windows系统安装Python3.X,安装Python模块,配合Sublime编辑器编译运行Python请移步视频教程第一期,or more>>>【第一期】Python网络爬虫视频教程-requests模块
【第二期】python网络爬虫视频教程-正则表达式
【第三期】python网络爬虫视频教程-采集百度相关搜索词
【第四期】python网络爬虫教程-Json格式
【第五期】python网络爬虫教程-采集百度下拉框
还在为英文关键词分类|分组感到困惑?一个python脚本自动化解决问题#encoding=utf-8#导入所需模块import pandas as pdimport numpy as npfrom openpyxl import load_workbook#定义一个列表,不同行业可以按材料,型号,工艺,疗效等分类分组,此处按型号keyword_list=["phone6","phone6s","phone8"]#pandas方法read_excel,读取文件准备分类的词库keywords.xlsx,这份词库是从引流关键词导出的,请保留它的抬头df_inner=pd.read_excel("keywords.xlsx",encoding="utf-8")#drop_duplicates方法去重df_inner.drop_duplicates(subset=None, keep="first", inplace=False)# df_inner=df_inner.loc[df_inner["词"].isin(["ipl"])]n=1#遍历去读取列表for i in keyword_list: #判断‘词’这一列是否包含i,而i则是keyword_list中每一个想要按这类词分组的关键词 df_out=df_inner.loc[df_inner["词"].str.contains("%s"%i)] #输出‘词’和‘搜索指数’这两列 category=df_out[["词","搜索指数"]] #理解为pandas可识别的对象 category=pd.DataFrame(category) print (category) #以下一整块都是为了将分类分组好的关键词输出到同一个exlce文件中不同的sheet book=load_workbook("keywords.xlsx") writer=pd.ExcelWriter("keywords.xlsx",engine="openpyxl") writer.book=book writer.sheets=dict((ws.title,ws) for ws in book.worksheets) category.to_excel(writer,"%s"%i,index=0,startrow=0,startcol=0) writer.save()