【经典算法】:基于中文字符分析的统计频率算法实现

本文介绍了如何使用统计频率算法来高效地分析一篇中文文章中字符出现的次数,避免了手动统计的繁琐。技术基础涉及中文与英文在计算机中的存储区别,通过特定的存储结构和数据分离方法实现。接着详细讲解了文件读取、数据分离和统计的步骤,最后展示了一段代码和运行截图。
摘要由CSDN通过智能技术生成

前言

//这篇文章和我的上篇文章 :英文频率统计
//息息相关,可以作为参考

正文:

在生活中,我们会有这样的困扰,比如说要统计一篇作文中 某个字符出现的次数,该咋办?

人工肯定会这么弄,把一篇文章从第一个数到最后一个,然后统计出来

这样确实不错,但是当文章足够大时就显得特别费劲,并且特别笨重,所以就一定要智能的完成这个功能,这篇文章所介绍的技术就是这个,当然基于这个基础还能干很多的事,这得需要探讨才能发现。

技术基础

关于计算机里面中文和英文的存储区别:
中文:用两个字节存储
英文:用一个字节存储
这里参考我一篇文章:中文的计算机存储格式
所以中文在分离时就要用一些特殊的方法,我这里用了一个存储结构
1)用字符串存满文章的各个字,不管是中文还是英文都存进字符串里面去
2)用一个特殊的结构来存储字符,这样保证中文和英文都能分离
3)利用类似冒泡排序的方法查找重复的元素,然后统计,最后输出结果

技术实现

1)文件读取技术,把txt文件里面的数据读取出来
2)数据分离:把txt里面的中英文分离,放到指定的存储结构里面去(struct 结构体)
3)数据统计:把数据放进统计的结构体里面去,同时记录其值

代码

//author :seen
//time: 2015-10-11
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值