1、网址文件
选择头条作者主页的网址,样式如下:
https://www.toutiao.com/c/user/token/MS4wLjABAAAA6xLVqfrc_2OPbN931drfinEDvZbv6Ngvr1eJ1DfxW_zK9fobDMa26-yHWxHSXnj5/?source=tuwen_detail&log_from=d6de837fae309_1720705896430&tab=article
2、保存目录
图片、文章网址、word文章都会保存到这个目录下面。
ids.txt 存放采集过的文章id ,滤重用的
images目录存放采集到的图片
docx目录存放保存的文章word文档
3、模式
勾选:保存url ,只保存头条文章url
勾选:保存txt,保存头条文章内容为txt,下载图片到images目录
勾选:保存docx,保存头条文章内容为docx,下载图片到images目录
可多选
4、阅读量最小值
例如:1000,意思:只保存阅读量超过1000的文章
5、时间限制
必填项,采集这个日期之后的数据,不采集之前的数据,格式:年-月-日 时:分:秒,例如:2024-06-06 22:16:00
注意冒号是英文冒号
6、延迟时间
每次采集完1条数据之后的延迟时间
7、强制监控采集
除基本设置【模式】设置,【延迟时间】以外,其他设置失效,【阅读量:0】【时间设置:今天】【翻页数量:1】,只采集当天最新数据,无限循环,只有退出软件才停止,否则无限循环监控采集
8、头条cookie
头条cookie获取流程,打开谷歌浏览器---- 进入头条主页 ---- https://www.toutiao.com/ ---- F12 ---- 点击 网络,(英文:network) ---- 刷新页面 ---- 寻找一个头条的网址 ---- 标头 ---- 请求标头 ---- 里面有cookie ---- 复制一下字段值,填写到软件,不懂提取的话,可以看下这个教程:https://www.bilibili.com/video/BV1z34y1s7qV
9、注意事项
头条存在反爬,延迟时间要卡的稍长一些,尽量不要触发头条反爬
10、演示视频
头条作者文章批量采集软件 今日头条最新文章爆文采集软件工具 介绍视频