(原文链接:https://abseil.io/tips/10 译者:clangpp@gmail.com)
每周贴士 #10: 分割字符串,不必拘小节
- 最初发布于:2012-08-16
- 作者:Greg Miller (jgm@google.com)
- 更新于:2018-01-24
I tend to have an odd split in my mind. –John Cleese
(译者注:在文章开始引用一段名人名言是TotW的一个习惯,有点像汉语里的起兴,跟“孔雀东南飞,五里一徘徊”差不多,给人一种很厉害的感觉,但不影响正文阅读)
(译者注:译者文学素养太洼,看不懂,此处保留原文)
将字符串分割为子串是任何通用编程语言的常见操作,C++也不例外。这个需求出现在Google的时候,很多工程师发现他(她)们掉进了一堆(且不断增加的)“分割函数”填成的泥沼。你必须搜寻那个输入参数、输出参数和语义都满足你要求的函数。在考察过600多行的头文件里的50多个函数之后,你也许会最终决定使用一个命名拐弯抹角的函数SplitStringViewToDequeOfStringAllowEmpty()
。
为了解决这个麻烦,C++库团队实现了一个新的API来分割字符串,放在了absl/strings/str_split.h
里。
这个新的API用一个absl::StrSplit()
函数取代所有类似的分割函数。absl::StrSplit()
接受一个准备被分割的字符串和一个分隔符参数。其返回的子串集合可以自动适配为调用者接收的容器类型。absl::StrSplit()
的内部实现使用absl::string_view
,因此非常高效。除非调用者显式要求将结果存储为字符串对象集合,否则字符串内容不会被复制。
闲言少叙,看例子吧:
// 用逗号分割。结果存储为vector<string_view>(没有字符串内容的复制)。
std::vector<absl::string_view> v = absl::StrSplit("a,b,c", ',');
// 用逗号分割。结果存储为vector<string>(字符串内容复制一次)。
std::vector<std::string> v = absl::StrSplit("a,b,c", ',');
// 用子串"=>"分割(并非"="和">"选其一)
std::vector<absl::string_view> v = absl::StrSplit("a=>b=>c", "=>");
// 用任一给定的字符分割(','或';')
using absl::ByAnyChar;
std::vector<std::string> v = absl::StrSplit("a,b;c", ByAnyChar(",;"));
// 结果存储在各种容器中(string可以替换为absl::string_view)
std::set<std::string> s = absl::StrSplit("a,b,c", ',');
std::multiset<std::string> s = absl::StrSplit("a,b,c", ',');
std::list<std::string> li = absl::StrSplit("a,b,c", ',');
// 等价于文中虚构的SplitStringViewToDequeOfStringAllowEmpty()
std::deque<std::string> d = absl::StrSplit("a,b,c", ',');
// 返回"a"->"1", "b"->"2", "c"->"3"
std::map<std::string, std::string> m = absl::StrSplit("a,1,b,2,c,3", ',');
更多信息,请参阅absl/strings/str_split.h获取API的使用方法,参阅absl/strings/str_split_test.cc获取更多示例。
谢谢你的阅读,闪人…(译者注:原文为Now I really gotta split…,用split跟文章主题双关一下。实在是不知道怎么翻译好,欢迎评论提建议)