关于腾讯的那道题截取字符串的题

最新推荐文章于 2023-05-30 06:25:57 发布

h57020877

最新推荐文章于 2023-05-30 06:25:57 发布

阅读量520

点赞数

文章标签：腾讯 html emc 面试浏览器算法

本文链接：https://blog.csdn.net/h57020877/article/details/5929280

版权

记得是前阵子去腾讯面试时的那道题，当时用笔我没写出来，就大概说了下思路，今天有空，就写了一下，发现要做到完美还是很麻烦的。

题目是:
假设有"123abc456def789"这么一个字符串,写一个函数，可以传入一个字符串，和一个要截取的长度。返回截取后的结果。

要求:
1 和标记不得计算在长度之内。
2 截取后的字符串，要保留原有标签，不过如果最后有一个标签没有闭合，则去掉其开始标签。

示例:
题中的字符串，要截取长度5，则返回的字符串应该为:123ab,要截取长度8，应返回123abc45。

我的做法大概思路是:
1 首先顺序读取字符串，并用一个resultstr变量来记录所有字符，当发现<标记时，开始将这个子字符串用tag变量记录下来。
2 如果发现tag变量形式为</w+>也就是html标签的开始标记)，就将其入栈。用栈结构来存储这个标记。若遇到<///w+>(html标签的结束标记)，就出栈。

3 否则如果是常规字符的话，长度计数器++。直到与传入的要截取长度相等。

4 最后判断栈是否为空，如果为空，直接返回截取后的字符串，否则，将栈中剩余元素一个个出栈，循环从截取后的字符串中查找栈顶标签元素最后一次出现的位置，返回索引，将这个标签替换为空。直到整个栈为空为止。最后返回处理后的字符串。

原题其实是没有考虑标签嵌套的情况的，我尽量的让程序可以处理嵌套标签，使其更健壮。并且尽量少的去用php的内置函数，因为那样可能会掩盖算法本身。如可以处理a1b2c3d4e5
这种形式的嵌套标签。但我发现如果标签是这种不规则形式a1b2c3d4e5的话，程序就会出问题了。因为我只将取到的结束标记与栈顶的元素相比较，而没有去循环搜索整个栈。这里要改一下其实也可以。

不知大家还有没有其他思路，我感觉我这么做实在是太麻烦了，罗罗嗦嗦一大堆。这么多代码面试时拿笔写非得疯了不可。而且这个时间复杂度不理想，大概为O(n*(n2))。空间方面也占了很多多余的空间。我相信一定有很简单的办法。希望大家一起想想有什么更简单的方法没？
应该说楼主的代码已经相当不错了

先提几点自己的看法
1、作为试题，考官已有先入为主的答案，任何对题面的深入剖析都可能被认为是画蛇添足。论坛首页上就有这样的报屈帖子
2、从题面入手就是边找html标记边计数（楼主也是这么做的）在到达退出条件时，检查缓存的html标记，因为不考虑嵌套所以处理成偶数个数即可，最后生成返回串。这样的代码量较少，即使不能上机调试，出错的概率也较小
3、作为实用函数，自然要考虑多些了。楼主的代码只考虑了一般性的标记配对，而忽略了html中是允许独立标记<hr> 、自封闭标记 等等出现的。而标记无论嵌套多少层，是否匹配，在浏览器中的表现都是一样的