某大学计算机系的成绩,数据格式如下所示:
Tom,DataBase,80
Tom,Algorithm,50
Tom,DataStructure,60
Jim,DataBase,90
Jim,Algorithm,60
Jim,DataStructure,80
……
请根据给定的实验数据,在 spark-shell 中通过编程来计算以下内容:
(1)该系总共有多少学生;
val lines=sc.textFile("/test/Data1.txt")//打开文件 val par=lines.map(row=>row.split(",")(0))//切分取第一数值 val distinct_par=par.distinct()//