数据是从Kaggle上下载的,大致是一个印度大学对学生在毕业后就业情况的调查,主要是MBA的学生。
大致长这样:15列,215行
这份数据基本没有什么需要修改或者完善的(也就是清理)地方。但我还是进行了几个步骤。
1.是否有填null
public static boolean checkNull(String value){
return value==null||"null".equalsIgnoreCase(value)||value=="";
}
//返回某一列的所有不同取值
public static String allDifferentValues(int column,String data[][]){
String values=data[0][column];
for(int i=1;i<215;i++){
if(!values.contains(data[i][column])){
values+=", " + data[i][column]