python采集修改原创_Python打造站长工具之软文伪原创工具

本文介绍了一种基于jieba和同义词模块的编程方法,用于本地生成软文的伪原创内容,以优化SEO但避免抄袭。作者分享了从扫描txt文件、词性分析到重组句子的详细步骤,展示了如何利用这些工具创建独特但类似的文章。
摘要由CSDN通过智能技术生成

摘要

作为网站管理员,在网站的日常操作中,经常需要写一些软文章,以提高网站的访问流量,但是作为潘军的笔肯定不是那么好,想写一些文章,可惜肚子里没有墨水,这时,我们必须考虑转载别人的抄袭文章,这样做实际上对seo优化没有好处,因为它不是原创的,所以对seo也不是太有用,那么怎么办呢?

当然,还有一些方法。网上有很多关于软伪原创的工具。我也读过其中一些。他们似乎都收费。唉,潘凯恩没钱...然而,潘康奈是贪婪的。你知道蟒蛇,……然后你开始.........

设计理念

首先,我想做的是:本地工具、阅读txt文件、分析词性(动词、名词、代词等)。),然后提出一种或多种词性,将其转换为同义词,根据同义词的相似性选择它们,然后将其组合成新的文章。

程序的整体操作:扫描txt文件夹->读取文件夹中的所有txt内容->部分语音过滤器同义词分析->将数据保存到新txt

在这里,我将选择结吧分词模块和同义词模块。当然,我们应该在编写程序之前安装这两个模块。jieba模块更容易安装,同义词模块更大,在cmd中直接安装可能更困难。我在pycharm完成了安装。

u=3134203252,3376181038&fm=173&app=25&f=JPEG?w=220&h=49&s=FE9815C2CF2D3B300C6D301E0300A0C3模块的安装模块安装

第一步是编写文件夹扫描和txt读取模块

文件夹的扫描,很容易通过操作系统模块扫描文件夹中的所有文件,返回列表,并将其传递给阅读模块进行文章阅读。文章阅读模块所做的是将txt文章的标题和内容返回给下一个模块。

我这边的每个txt文件都有相同的格式,所以我这边的文章阅读模块的规则是使用常规提取。如果您需要,您可以根据txt内容更改规则。

u=124894053,1610614383&fm=173&app=25&f=JPEG?w=628&h=324&s=E0C2B7441BE4844B4875100B0100E0C2txt文件的格式

u=2085081159,306826394&fm=173&app=25&f=JPEG?w=640&h=323&s=A8C2B3429AA1B16C16F1010B0000E0C3扫描模块和读取模块扫描模块和读取模块

第二步:词性分析、同义词分析、句子重组模块写作

对于开发的这一部分,需要使用两个模块,即在开始时安装的两个模块。我将首先直接编写代码:

首先,通过口吃分割对输入句子进行分割,并返回分割信息和词性。然后我们根据一定的规则过滤词性,过滤特定词性的同义词,将它们的返回值添加到列表中,最后通过join()方法将列表组合成一个句子。在以后的阶段,我们只需要调用这个模块来导入每个句子来生成变形的句子。

步骤3: txt编写模块编写

这部分没有困难,也就是说,直接将txt写入另一个文件。

u=1107848790,793715868&fm=173&app=25&f=JPEG?w=616&h=91txt写入模块Txt写模块

步骤4:写入逻辑操作条目

这个模块是整个程序的逻辑入口。我们首先使用扫描模块遍历其返回值,依次读取txt文件,将txt文件的内容传输到文章转换模块,最后调用txt编写模块生成一个新文件。当然,新文件的内容已经改变了。

u=3568568608,540373125&fm=173&app=25&f=JPEG?w=541&h=267&s=A8C2834602F0BD680678FC0A0000A0C1逻辑入口逻辑条目

总体代码

u=1935107893,2810732020&fm=173&app=25&f=JPEG?w=640&h=352&s=AE9015C31BB5B04F16FDC90B0000F0C3代码一

u=702015642,2213132737&fm=173&app=25&f=JPEG?w=640&h=539&s=AE9015CBD2AC934F5C451C06020070C2代码二代码2

效果图:

u=1049609607,2840260075&fm=173&app=25&f=JPEG?w=639&h=374&s=F0D231C45BEF836C14E5B40D0100B0C1运行图

u=3201726557,2369051963&fm=173&app=25&f=JPEG?w=639&h=374&s=E8C2B54412ED836C0E69DD030000B0C3左边是生成的右边是原来的左边是生成的,右边是原始的

摘要

总的来说,效果仍然很明显。一个小工具已经完成。项目地址:https://gitee.com/Tony.bin/Pseudo_Article.git

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值