前言
//这篇文章和我的上篇文章 :英文频率统计
//息息相关,可以作为参考
正文:
在生活中,我们会有这样的困扰,比如说要统计一篇作文中 某个字符出现的次数,该咋办?
人工肯定会这么弄,把一篇文章从第一个数到最后一个,然后统计出来
这样确实不错,但是当文章足够大时就显得特别费劲,并且特别笨重,所以就一定要智能的完成这个功能,这篇文章所介绍的技术就是这个,当然基于这个基础还能干很多的事,这得需要探讨才能发现。
技术基础
关于计算机里面中文和英文的存储区别:
中文:用两个字节存储
英文:用一个字节存储
这里参考我一篇文章:中文的计算机存储格式
所以中文在分离时就要用一些特殊的方法,我这里用了一个存储结构
1)用字符串存满文章的各个字,不管是中文还是英文都存进字符串里面去
2)用一个特殊的结构来存储字符,这样保证中文和英文都能分离
3)利用类似冒泡排序的方法查找重复的元素,然后统计,最后输出结果
技术实现
1)文件读取技术,把txt文件里面的数据读取出来
2)数据分离:把txt里面的中英文分离,放到指定的存储结构里面去(struct 结构体)
3)数据统计:把数据放进统计的结构体里面去,同时记录其值
代码
//author :seen
//time: 2015-10-11