用C++顺序查找处理中文字符串

最新推荐文章于 2023-05-12 13:56:58 发布

六月的流火

最新推荐文章于 2023-05-12 13:56:58 发布

阅读量1.5k

点赞数 3

文章标签： c语言算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_72608151/article/details/126146692

版权

大家都知道WPS中，Word文档在输入过程中会自动统计字符。

受博主@一头小山猪所撰写的经典算法专栏启发，决定利用所有查找算法中最基本的顺序查找，检索一段汉字中同一关键字出现的位置，以及总出现次数。

正文开始

一、问题分析

与一般的英文字符串不同，单个中文汉字占据了两个字节大小。此外中国人的语言习惯是不使用空格作为分隔符，而是使用中文标点符号分割。因此，这虽然为统计带来了麻烦，但极大地方便了输入操作。

并且，中文输入有语法逻辑，不需要进行排序。

二、解决思路

1.中文字符段落长度一般较短，而字符串数组本身不容易实现动态数组的操作，故通过数组大小设置最多不能输入超过1000字。（2000字节）（char a[2000];)

2.中文的关键字会以字符串形式存储，加上结尾的'\0'，总计3个字节（char b[3];)

3.中文字符的查找需要遍历整个输入数组a的实际长度，而比对则需要将每两个字节与关键字字符串数组逐一比对，故使用for循环+if嵌套的结构：只有第一个字节相同，才会比对第二个字节，若两个字节都相同，则说明是同一个汉字。

4.每个字符占两个字节，肉眼看来，其位置就是（数组下标+1）/2（加一的原因是数组从a[0]开始）

5.需要一个计数器（num），统计总出现次数，请注意，这个计数器与数组遍历的计数器不可以重合。

三、代码实现

C++源代码如下：

运行结果：

四、算法时间复杂度与缺点

1.该算法需要遍历所有“有效字节”，故时间复杂度为o（n）；

2.该算法的缺点也很明显，最大输入字数有限；无法用文件直接导入；无法处理双语混合字符串。

欢迎指正与完善！

the end；

六月的流火

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
用C++顺序查找处理中文字符串

博文用简洁的顺序查找，处理了中文字符串，搜索关键字的位置与关键字的总出现次数。
复制链接

扫一扫

六月的流火 CSDN认证博客专家 CSDN认证企业博客

码龄2年

9: 原创

129万+: 周排名

135万+: 总排名

5278: 访问

: 等级

138: 积分

244: 粉丝

23: 获赞

16: 评论

17: 收藏

私信

关注

热门文章

最新评论

搜索与回溯算法入门
秦羽: 搜索合回溯讲解的很好，欢迎来指点我
搜索与回溯算法入门
会敲键盘的肘子: 深度优先搜索，支持
搜索与回溯算法入门
吉士先生: 内容详细
栈与递归函数
杜拜要睡觉了: 写得很好，终于明白了，受教了受教了～
栈与递归函数
进击的博仔: 对于一个栈，操作head并不能影响栈所能达到的最大容量（n）这句话很好，支持，期待继续更新

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。