记一次Airbnb的电面题目:
1.题目描述
将一个.csv文件进行切分。
已知一个.csv文件是按照逗号分割的每个item的,但是如果一个item里面自己有逗号,则整个item都会用双引号扩起来,如果item里面有双引号,则其前面再加一个双引号进行转义。举例如下:
John,Smith,”john”“.smith@gmail.com”,”Los,Angeles”,1
应该对应的真正字符串是:
John,Smith,john”.smith@gmail.com,Los,Angeles,1
输出要求:将各个item用|进行连接,上面的例子输出结果应该为:
John|Smith|john”.smith@gmail.com|Los,Angeles|1
2.实现code
import java.util.ArrayList;
public class Main {
public static void main(String[] args) {
String str="John,Smith,\"john\"\".smith@gmail.com\",\"Los,Angeles\",1";
helper(str);
}
private static void helper(String str){
ArrayList<String> res=new ArrayList<>();
int len=str.length();
StringBuilder sb=new StringBuilder();
boolean isIn=false;//记录当前是否在一个双引号内
for(int i=0;i<len;i++){
if(isIn==false && str.charAt(i)=='\"'){//进入一个带双引号的item
isIn=true;
continue;
}
if(str.charAt(i)==',' && !isIn){ //遇到逗号且已遍历的item无双引号
res.add(sb.toString());
sb=new StringBuilder();
isIn=false;
}else if(str.charAt(i)==',' && isIn){//当前item带双引号且内部包含逗号
sb.append(",");
}else if(str.charAt(i)=='\"' && i+1<len && str.charAt(i+1)=='\"'){
sb.append("\"");
i++;
}else if(str.charAt(i)=='\"' && i+1<len && str.charAt(i+1)==',' && isIn){ //当前item带有引号且遍历结束
isIn=false;
continue;
}else{
sb.append(str.charAt(i));
}
}
if(sb.length()!=0)
res.add(sb.toString());
//print
for(int i=0;i<res.size()-1;i++)
System.out.print(res.get(i).concat("|"));
System.out.println(res.get(res.size()-1));
}
}