那些有趣短小的Python项目（1）--文字重复使用情况

最新推荐文章于 2021-03-26 10:22:09 发布

KoshiroH

最新推荐文章于 2021-03-26 10:22:09 发布

阅读量165

点赞数 1

分类专栏： python项目实战文章标签： python

本文链接：https://blog.csdn.net/qq_44872709/article/details/105456677

版权

python项目实战专栏收录该内容

2 篇文章 0 订阅

订阅专栏

项目介绍：

自己想开一个系列来分享自己在学python中遇到的那些有趣又短小的项目，并给那些初学者一些巩固的实战机会。
下面进入正题，有个搞数学建模的同学（嘻嘻），在网上面看到有人用虚词的使用的频率鉴定出《红楼梦》后40回并非曹雪芹原著，当时就感到很神奇，自己能不能编写一个类似的代码？

效果示例：

新闻.txt
在这里插入图片描述
结果.txt

源代码

with open('新闻.txt','r',encoding='utf-8') as f:#读取新闻文本
    text=str(f.read())
with open('结果.txt','w',encoding='utf-8') as f:#将结果写入当文本中
    numdict=dict()
    for word in text:
        if word not in numdict and word.isalnum():#如果该字符没被记录，并且属于字母或数字
         numdict[word]=text.count(word)
    numdict=sorted(numdict.items(),key=lambda e:e[1],reverse=True)#按从多到少的顺序对字典值进行排序
    inf='全文总共用到重复文字有'+str(len(numdict))+'个\n'
    f.writelines(inf)
    f.writelines(str(numdict))

KoshiroH

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
那些有趣短小的Python项目（1）--文字重复使用情况

项目介绍：自己想开一个系列来分享自己在学python中遇到的那些有趣又短小的项目，并给那些初学者一些巩固的实战机会。下面进入正题，有个搞数学建模的同学（嘻嘻），在网上面看到有人用虚词的使用的频率鉴定出《红楼梦》后40回并非曹雪芹原著，当时就感到很神奇，自己能不能编写一个类似的代码？效果示例：新闻.txt结果.txt源代码with open('新闻.txt','r',encodin...
复制链接

扫一扫