大家好,我是淘小白~
今天给【头条/微头条文章采集洗稿发布软件】做一个文字版的使用说明文档!
旧版说明文档(含视频):https://blog.csdn.net/u012917925/article/details/141280090
没点自学能力的朋友,文档都不看的朋友,操作一个步骤,问一句的朋友,请点击右上角的XX!实在服务不了,有心无力 ,不要浪费大家时间!谢谢合作~~
注意:软件版本一直在更新,可能后期软件界面会发生变化,但是主要的功能基本就这些了。
1、按照作者主页链接采集
1.1网址文件
格式txt,编码utf8,一行一个,放置作者主页的链接,如下图所示:
1.2保存目录
自定义选择文件夹
1.3基本设置
①保存url:所有文章的url网址都保存到一个txt中去,编码默认:utf8
②保存txt:图片放到 保存目录/images/ 下面,以文章标题命名子文件夹,子文件夹下面是图片文件
如下:
头条文章:
头条文章图片文件,路径样式:保存目录/images/头条文章标题/图片.jpg
头条文章文件,路径样式:保存目录/头条文章标题.txt
微头条文章:
微头条图片文件,路径样式:保存目录/images/微头条文章id/图片.jpg
微头条文章文件,路径样式:保存目录/微头条文章id.txt
图片下载的时候会裁剪图片,默认从底部裁剪28像素(无法自定义),这一点,下文按照链接采集是一样的。
图片文件保存路径示例:
③保存docx
文章保存成word文档
头条文章:
头条文章图片文件,路径样式:保存目录/images/头条文章标题/图片.jpg
头条文章文件,路径样式:保存目录/头条文章标题.docx
微头条文章:
微头条图片文件,路径样式:保存目录/images/微头条文章id/图片.jpg
微头条文章文件,路径样式:保存目录/微头条文章id.docx
④阅读量
只采集大于该阅读量的文章,比如:2000,文章阅读量低于2000的不采集,只采集阅读量大于2000的文章
⑤时间限制
时间限制:只采集设定时间以后发布文章,比如:2024-08-21 00:00:00,只采集这个时间以后发布的文章,格式必须是:年-月-日 时:分:秒
⑥翻页数量
可以理解成下拉次数,翻页越多,采集的数据相应越多。
⑦延迟时间
采集到一篇文章之后的暂停时间
1.4开启强制监控采集
只采集最新数据,阅读量=0, 时间=当天,其他设置有效。
1.5头条/微头条 选项
选择采集头条文章,还是微头条文章。
1.6头条cookie
头条cookie,能用的情况下尽量不要更换,切记!
1.7 ids.txt文件
这个文件软件会自动创建,在软件的根目录下面,主要用于存储采集过的文章id,用于滤重使用,采集过的文章id会保存到这个文件中去,可以删除,删除之后,下次执行还会自动创建。
下面按照链接采集的也会记录到这个文件中去,也会起到滤重的作用。
2、按照链接采集文章
2.1网址文件
格式:txt
里面可以存储头条文章的网址,也可以存储微头条文章的网址,微头条的文章网址必须是带/w/的,不可以是跳转的网址,也不可以是移动端分享的网址,都无法识别。
软件,根据/w/区分是不是微头条的文章,根据网址中的数字,提取文章id,进行采集。
罐头和易撰网下载的微头条网址,都是跳转网址,要保证微头条网址中是https://www.toutiao.com/w/*****格式的,只有这种格式的才能被识别到
这里面不可以放置头条作者主页的网址,无法识别文章id。
也可以不放置其他平台的网址,识别不到。
不要有空行,不要有中文汉字占据一行,这些都可能会导致软件无法正常识别网址id。
保存目录:自定义选择存储文件夹
2.2基本设置
保存txt: 下载图片,保存txt文章
头条文章图片文件,路径样式:保存目录/images/头条文章标题/图片.jpg
头条文章文件,路径样式:保存目录/头条文章标题.txt
微头条图片文件,路径样式:保存目录/images/微头条文章id/图片.jpg
微头条文章文件,路径样式:保存目录/微头条文章id.txt
保存docx:下载图片,保存docx文章,docx自动配图(原文顺序)
头条文章图片文件,路径样式:保存目录/images/头条文章标题/图片.jpg
头条文章文件,路径样式:保存目录/头条文章标题.docx
微头条图片文件,路径样式:保存目录/images/微头条文章id/图片.jpg
微头条文章文件,路径样式:保存目录/微头条文章id.docx
2.3头条cookie
头条cookie,能用的情况下尽量不要更换,切记!
3、文章改写功能
3.1选择文件
选择数据文件路径
选择文件路径,这里调用的是txt数据,也就是我们前面采集到的数据
如下图所示:
我们调用这个./data/目录,下面必须要有:./data/images/这个目录,这个目录下面存放的是文章的图片,如下:
./data/目录下面放置我们的文章,格式是txt格式的,编码是UTF8。
选择保存目录
自定义选择保存目录
3.2基本设置
比特浏览器窗口id
可以设置多个,多个窗口切换使用,当遇到ai使用限制时会自动切换下一个窗口,我们需要提前创建几个比特浏览器窗口,并提前登录好我们的账号。
多个id,使用英文逗号分隔,如果不是英文逗号分隔,可能会出现报错。
这里的id 可以识别比特浏览器的序号,也可以识别窗口的id,放哪一种都可以,建议:使用序号,序号如果能正常使用,更加直观一些,使用比特浏览器的窗口id,更长,不直观。
序号提取:下面的第一个窗口序号是1
浏览器窗口id提取:
得到的窗口id :e02eddbd2ffc40169a5fa2ed7a1026fa
窗口的id更长一些
上面两种,序号/id 软件都可以自动识别。
相似度
相似度指的是:原文文章和ai改写后的文章的相似度,相似度越高,原创度越差。
这里面设置相似度A,ai改写完之后,与原文对比,如果相似度小于A ,就保存文章,符合我们的原创度要求。
这里建议,设置到10以下。
提取段落
提取段落是根据我们指令来自定义的,默认的是2:
它的意思是,提取第二个回答及以后的内容
推荐使用上面的方式设置。注意是英文冒号
其他设置方式:
;提取AI全部回答内容,设置0
;提取第1次AI回答的内容,设置1
;提取第1个回答到第3个回答的数据,设置为1:2,冒号为英文冒号
上面也可以进行指定提取。
延迟时间
每次改写完一篇文章之后的暂停时间
屏蔽关键词
屏蔽关键词一行一个,里面的内容会被替换成空值
AI改写平台
现在软件接入的ai平台有:gpt\poe\kimi\通义千问\claude\豆包\智谱清言\文心一言,后续还可能会继续增加,软件更新之后会发布到云盘链接中去,购买的朋友都会拿到这个链接,到时自己去下载更新即可。
gpt 内容发送的是文字,其他平台内容是以文件的形式发送的。
gpt发送文件会触发官方的一些机制,导致无法继续往下写,只能发送文字,如下:
屏蔽段落关键词
屏蔽段落关键词,只要在提取的段落中,发现了这个关键词,这个段落就不会被保存下来。
慎用!这样删除的内容太多,谨慎使用!
3.3AI指令
标题通配符:{title}
内容通配符: {content}
指令分割符 :<__prompt__>
给一个测试指令:
根据上面文章列出3个提纲,原文标题:{title} 内容:{content}
<__prompt__>
根据第1个提纲对比原文段落,使用口语化的叙事手法,逐段进行改写,只输出改写之后的内容,不要有小标题
<__prompt__>
根据第2个提纲对比原文段落,使用口语化的叙事手法,逐段进行改写,只输出改写之后的内容,不要有小标题
<__prompt__>
根据第3个提纲对比原文段落,使用口语化的叙事手法,逐段进行改写,只输出改写之后的内容,不要有小标题
3.4保存txt 或者docx
改写完之后,符合相似度要求的文章,会被保存成这两种格式。
保存成txt
软件会自动把对应的txt 及 文章的图片移动到保存目录。
我们在发布的时候,如果调用这里的数据,文件夹的名字就是文章的标题,这里为了方便大家微调,直接调用文件夹的名字作为头条文章的标题使用。
注意:文章的标题不要超过30个字符,超过30字符,会发布失败,头条官方对标题文字数量有限制。
相似度不合格的文章,会再下一轮次进行改写。
如下:
保存成docx
下载图片到保存目录,同时生成docx 文档,文档配图使用的是内置方法配图,非原文图片顺序配图。
后续更新,改写功能更新:
头条微头条采集改写发布软件V2.6,改写功能增加相关文章网址提取功能,混淆原文提高原创度
3.5原创度&罐头cookie
这个地方调用是罐头创作平台的原创度检测接口,一个账号一天100多次检测,经测试,设置到65的原创度就可以过首发了,能过80原创度的很少,如果有这样的指令,希望分享给我一下(#^.^#)
cookie需要自己登录自己的账号去罐头网页端提取一下,大概流程:谷歌浏览器登录罐头----F12 ---- 网络 ---- 请求标头 ---- cookie字段的值 ----选中 ---- ctrl+c ---- ctrl+v
**************************************************************
发布文章之前一定要审稿!发布文章之前一定要审稿!发布文章之前一定要审稿!
官府负能量/灰色擦边/ 审不过,审过了也会下架
恶意造谣,别给自己找麻烦
**************************************************************
4、文章发布功能
4.1 选择文件
文章目录:选择txt数据或者docx 文档
选择txt文档是模拟手工发布,选择docx文档,模拟手工上传。
选择txt数据发布,下面文件夹的名字就是文章标题
选择的是AI改写完的txt数据目录,例如:
里面存储的是图片和txt文件,如:
发完移至目录:发布过的数据会移动到这个目录
4.2基本设置
比特浏览器窗口id:可以识别序号,可以识别窗口id ,和上面的是一样,可设置多个,英文逗号分隔
每号发布数量:每个账号发布文章的数量,发完一个账号之后发第二个账号;
标注:txt 说明只对txt数据设置有效
图上传数量(txt):微头条和头条设置有效,选填,不设置 就是全部上传
几段1图:前两段不插入图片,后面按照几个段落1图插入图片
图片乱序:乱序就是打乱图片顺序上传,否则按照下载顺序上传,设置0或者1;
延迟时间:发布完一篇之后的暂停时间
是否首发:设置0或者1,0不勾选首发,1勾选首发
4.3发布设置
发布类别:头条、微头条设置有效
设置标题:单标题或者多标题,只对头条文章有效,对微头条无效;头条已取消多标题&单标题
设置封面图:对头条文章有效,对微头条无效;
设置广告:只对头条文章有效,微头条无效;
是否同步:头条,微头条设置有效
作品声明:头条,微头条设置有效
4.4草稿/发布
发布到草稿或者直接发布,头条微头条设置有效
其他:有些朋友有自己的发布软件,可能只需要采集改写功能,软件没法拆分,目前只能整体购买。
刚开始接触的朋友,先使用采集、再使用改写、最后使用发布。
后面的改写和发布都是基于前面采集来处理的。
软件需要用到比特浏览器,需要自己注册安装一个,新建浏览器窗口,用到大模型就用比特登录,需要用魔法的自己整个魔法。
软件按月出售,不定期更新,软件更新下载链接,下单后,会发送给大家,保存一下。
在使用中,如果遇到什么bug,欢迎大家反馈给我,会尽快修复!
4.5罐头存稿
罐头存稿是直接发到云草稿箱的,没有直接存到指定账号里面去,功能单一
4.6多线程发布设置
开启多线程发布,并发窗口就是并发线程,其他设置于单线程的一样。
开启账号循环发布,只适用于单线程,软件会进入无限循环发布状态
**************************************************************
快速上手要领:采集保存成txt,改写之后保存成txt
先采集,再改写,最后发布
采集的数据保存路径 是 改写的数据导入路径
改写的数据保存路径 是 发布的数据导入路径
**************************************************************
--------------------------分----割----线--------------------------
关于退款:
有朋友拿过去之后,感觉一脸懵,看了介绍文档之后,还是搞不明白,采集也搞不了明白,洗稿也搞不明白,发布更搞不明白。
没事!可以秒退款!
一点都搞不明白的话,绝不勉强,只限当天购买当天退款!
别买完之后,用了10天半个月了,再找我申请退款,这种情况拒绝退款!
还有一种情况是可以秒退款的,就是电脑系统不兼容,这种也是可以秒退款的!
--------------------------分----割----线--------------------------
更新日志:
20240901:优化单标题&多标题点击,因分辨率问题,点击不准确问题
20240904:改写增加多线程,发布增加自定义篇头篇尾文字图片功能
详细介绍:
头条微头条采集改写发布软件V2.8,增加改写多线程,增加篇头篇尾自定义文字图片
20240906:增加 罐头创作 平台存草稿功能,只能存头条文章草稿,没法存其他文章草稿
20240914更新: