假设给出了一个CEPS 数据库数据,用Python完成下列问题: (1)读取学生问卷数据, 'data2013\cepsw1studentEN.dta',提取其中的'ids'(学生 id), 'clsids' (学生所在班级 id), 'tr_chn', 'tr_mat','tr_eng','a01','a03', 'a06','c18','b01','a15','b06', 'b07', 'b09', 'c12'等列,完成相关数据清洗工作: ①删除含有缺失值的行(any)。 ②'tr_chn', 'tr_mat','tr_eng'分别表示被调查学生的语文、数学和英语成绩,请添加一个新列计 算三门课程的总分, 记为 Y_score。 ③请结合’七年级学生问卷 2013.pdf’ 、’七年级学生问卷 2013En.pdf’ , 请选择适当的归纳方 式,将'a01','a03','a06','c18', 'b01', 'a15', 'b06','b07','b09', 'c12'等列归纳到 0/1 虚拟变量,【例如 'a03'中, 'The Han nationality'记为 1,其他所有答案记为 0;'b06'表示妈妈的受教育水平,将 'Senior high school degree', 'Junior college degree', 'Bachelor degree', 'Master degree or higher'记 为 1,其余答案记为 0】,并注意这些列的名称需设定为有一定含义的中文或英文。 ④展示清洗完成的表格, 删除多余的列, 最终结果包含【'ids','clsids', ‘Y_score’, 和'a01','a03', 'a06', 'c18', 'b01', 'a15', 'b06', 'b07', 'b09', 'c12'调整后的结果】共计 13 列。