python 百度收录查询site爬虫,百度快照标题内容爬取
修改数字,想要哪页,(0,为一页,1为一页,2为两页);(3,6)为 第3页到第5页的内容。print('正在爬取:{},共查询到{}个结果'.format(url, len(link)))# 抬头需使用 # -*- coding: GB2312 -*- ,用utf-8 ,输出DOS窗口,中文汉字为乱码;# 下面代码为 读取CSV文件,跳过第一行,并检查其余每一行,过滤含有"ID"的行,并填加自增列,并保存新表内。# 创建的文件,写入数据,原有数据不变,注:表格禁止打开编辑,否则再用会乱码。
原创
2024-05-08 15:58:55 ·
155 阅读 ·
1 评论