项目介绍
- 本项目通过分解各大厂的常见笔面试题,追本溯源至数据结构和算法的底层实现原理,知其然知其所以然;
- 建立知识结构体系,方便查找,欢迎更多志同道合的朋友加入项目AlgorithmPractice,(欢迎提issue和pull request)。
- 在这里,我收集并总结了13道的字符串题目,来展示BATJHPM(字节、阿里、腾讯、京东、华为、拼多多、美团)可能会出现的字符串笔试题。🌟表示难易程度 。
值的你关注并提升你薪资待遇的面试算法:开源数据结构和算法实践
正文开始
-
(🌟):【1】判断两个字符串是否相等
- 比如:
- 正案例:“abcd”相等于“abcd”,
- 反案例:“asd”不等于“ascd”。
- 这个不难,jdk提供了equals方法,当然我们可以重写,特殊情况下重写时,一般会注意到“计时攻击”问题(一般应用于用户密码破解),不清楚的可以见我的博客:面试姊妹篇3:常用方法中的错误,第5条:计时攻击。
- 比如:
-
(🌟):【2】将输入的字符串排序
- 比如:
- 正案例:输入“123564”,输出“123456”。
- 反案例:空串为0。
- 本题使用内部排序算法即可,有兴趣可以参考:十大经典内部排序算法及延伸。
- 比如:
-
(🌟🌟):【3】将输入字符串按照全排列的方式打印输出
- 比如:
- 正案例:输入“abc”,输出“abc”,“acb”,“bac”,“bca”,“cab”,“cba”。
- 反案例:空串为0。
- 本题使用回溯法即可,
- 具体见代码:字符串全排列输出,测试用例:StringCombinationTest。
- 比如:
-
(🌟🌟):【4】给你一个字符串,按照先序遍历的方式构造成一棵二叉树
- 比如:
- 正案例:输入“124NNN357NN8NN6N9NN”,输出该二叉树。
- 反案例:空串输出null。
- 本题使用先序遍历构造二叉树即可。具体可以参考本人另外一篇文章:二叉树序列化和反序列化的两种方式
- 比如:
-
(🌟🌟🌟🌟):【5】判断一个字符串是否出现在另一个字符串内
- 比如:
- 正案例:“abcd”出现在“1234abcddf”中以及字符串“hjabcdef”中
- 反案例:“abcd”不出现在“ab1cdef”中。
- 这边我们提供了五种字符串匹配算法来解决此类问题,分别是
- 1、BF(Brute-Force)算法
- 2、BM(Boyer-Moore)算法
- 3、RK(Rabin-Karp)算法
- 4、KMP(Knuth-Morris-Pratt)算法
- 5、Sunday 算法
- 关于上述五种算法的理解,我写在五大字符串匹配算法中,欢迎移步。
- 多说一句:我们在Linux环境中用的grep指令,用的就是BM算法。
- 比如:
-
(🌟🌟🌟):【6】判断某个字符串序列是否存在于另一个字符串内
- 比如:
- 正案例:“1234”出现于“1a2b3c4d”中
- 反案例: “1234”不出现于“1a2b3cd”中,也不出现在“1a3b2c4d”
- 这种题型,
- 常见的解法是使用双指针SequenceExist,测试用例:SequenceExistTest,
- 另外我们还提供一种叫做字符串预处理法,来解决字符串匹配问题,测试用例:ProdealStringTest。
- 如果是找出这两个字符串的最大公共子序列LCS,测试用例:LCSTest,
- 比如:
-
(🌟🌟🌟🌟):【7】判断某个字符序列,在乱序的情况下,是否存在于另一个字符串内
- 比如:
- 正案例:“abcd”乱序存在于“12cdbam”中,
- 反案例:“123”并不存在于“12456as”中
- 我们提供了滑动窗口来解决此类问题,具体见我的博客:头条最热笔试题:利用滑动窗口来解决字符串匹配。
- 再稍微难一点的,会问乱序序列在另一个字符串中出现了几次,比如这道题:找所有字母异位词(FindallAnagrams),测试用例:FindallAnagramsTest,上述链接也有收录。
- 比如:
-
(🌟🌟🌟):【8】找出这个字符串中单调递增的最大子串
- 比如:
- 正案例:
- “1234156”中最长的递增子串是“1234”,最大递增长度是4,
- “654321”中最大递增长度是1。
- 反案例:空串为0
- 这类题目很简单,一般是采用一头一尾双指针来做,每次指针变动,做差,来判断指针长度并更新最大值,最后输出最大值,如果这道题改成字符串中不重复的最大子串,那么双指针改成treemap来做,输出treemap.size()即可。
- 正案例:
- 比如:
-
(🌟🌟🌟):【9】最长递增子序列
- 比如:
- 正案例:“1234156”中,最长的递增子序列是“123456”
- 反案例:空串为0
- 对于这个类型的题目,我总结出六种解法
- 1、暴力法
- 2、动态规划法
- 3、分治法
- 4、字符串对比法
- 5、分支限界法
- 6、扑克法。
- 关于上述六种算法的理解,具体见我的博客:最长递增子序列的六种解法
- 比如:
-
(🌟🌟🌟):【10】最大子段合
-
(🌟🌟🌟):【11】回文创造
- 给定一个字符串s,你可以从中 添加 一个 字符,使得剩下的串是一个回文串
- 比如:
- 正案例:“abca”通过添加一个a变成回文串“abcba”。
- 反案例:“abcde”无法通过添加某一个字母变成回文串。
- 这类题目一般是采用动态规划来做,具体见代码:回文创造,测试用例:PalindromeTest。
-
(🌟🌟🌟🌟):【12】编辑距离
- 在两个单词之间,由其中一个单词转换为另一个单词所需要的最少单字符编辑操作次数。定义的单字符编辑操作有且仅有三种:插入(Insertion)、删除(Deletion)、替换(Substitution)
- 比如:
- 正案例:由 “kitten” 转换为 “sitting” 需要的最少单字符编辑操作有:
- 1.kitten → sitten (substitution of “s” for “k”)
- 2.sitten → sittin (substitution of “i” for “e”)
- 3.sittin → sitting (insertion of “g” at the end)
- 反案例:
- 正案例:由 “kitten” 转换为 “sitting” 需要的最少单字符编辑操作有:
- 这类题目一般是采用动态规划来做,具体见代码:编辑距离,测试用例:EditDistanceTest。
-
(🌟🌟🌟🌟):【13】字符组成判断
- 给定一个非空的字符串s和一个字典wordDict,判断 s 是否可以由 wordDict 里面的词组成
- 比如:
- 正案例1:s = “leetcode” 可以由字典dict = [“leet”, “code”]内的词组成。
- 正案例2:s = “leetcode” 可以由字典dict = [“leet”, “code”, “nihao”]内的词组成。
- 反案例:s = “nihaozhangsan” 不可以由字典 dirc = {“ni”, “hao”,“ljfirst”,“we”,“zhang”}内的词组成
- 这类题目一般采用动态规划来做,具体见代码:字符组成判断,测试用例:StringInDicTest。