【经典算法】:基于中文字符分析的统计频率算法实现

最新推荐文章于 2020-12-17 11:20:11 发布

seen_in_hw

最新推荐文章于 2020-12-17 11:20:11 发布

阅读量2.3k

点赞数

分类专栏：经典算法探究算法学习简单算法应用制作工具文章标签：算法技术生活

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23100787/article/details/49056003

版权

本文介绍了如何使用统计频率算法来高效地分析一篇中文文章中字符出现的次数，避免了手动统计的繁琐。技术基础涉及中文与英文在计算机中的存储区别，通过特定的存储结构和数据分离方法实现。接着详细讲解了文件读取、数据分离和统计的步骤，最后展示了一段代码和运行截图。

摘要由CSDN通过智能技术生成

前言

//这篇文章和我的上篇文章：英文频率统计
//息息相关，可以作为参考

正文：

在生活中，我们会有这样的困扰，比如说要统计一篇作文中某个字符出现的次数，该咋办？

人工肯定会这么弄，把一篇文章从第一个数到最后一个，然后统计出来

这样确实不错，但是当文章足够大时就显得特别费劲，并且特别笨重，所以就一定要智能的完成这个功能，这篇文章所介绍的技术就是这个,当然基于这个基础还能干很多的事，这得需要探讨才能发现。

技术基础

关于计算机里面中文和英文的存储区别：
中文：用两个字节存储
英文：用一个字节存储
这里参考我一篇文章：中文的计算机存储格式
所以中文在分离时就要用一些特殊的方法，我这里用了一个存储结构
1）用字符串存满文章的各个字，不管是中文还是英文都存进字符串里面去
2）用一个特殊的结构来存储字符，这样保证中文和英文都能分离
3）利用类似冒泡排序的方法查找重复的元素，然后统计，最后输出结果

技术实现

1）文件读取技术，把txt文件里面的数据读取出来
2）数据分离：把txt里面的中英文分离，放到指定的存储结构里面去（struct 结构体）
3）数据统计：把数据放进统计的结构体里面去，同时记录其值

代码

//author :seen
//time: 2015-10-11

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。