\quad 由于数据来源各不相同,原始数据有时比较零乱,因此在进行数据分析之前需要进行一系列的操作,例如重复值的处理,数据分列合并等。
一、重复数据处理
1.“删除重复项”功能
\quad
哪列数据需要删除重复值就选哪列,当选择多个列时表示这些列的值同时一样才作为重复值删除,全选则表示删除相同的记录(一般为保证数据一一对应都是全选)。
2.“条件格式”找重复值
\quad
通过条件格式功能快捷找出重复值,用特殊格式标记出来,然后再采取对应的处理方法。
3.高级筛选功能
二、数据行列位置调整
\quad
有时数据的行列位置需要调整,即移动某行/列的位置
法一: 选择需要移动的行/列,Ctrl+X,然后定位到需要移动的位置,单击鼠标右键选择“插入剪切的单元格”,即可将数据移动到此位置上。
法二: 选择需要移动的行/列,将鼠标指针指向该行/列的边缘,指针变成双十字箭头时,按下shift键,同时按住鼠标左键拖动鼠标,移动到要移到的位置,此时会出现一个粗线条,松开鼠标即可完成移动。
三、数据的合并与拆分
1.分列拆分数据
\quad
分列拆分数据需要源数据具有规律,如有相同的宽度或者使用同一种分隔符。
再对行标识进行设置即可。
2.合并两列数据
利用公式和 & 连接符
注意: 一般无法直接使用&连接符连接日期或时间数据,因为在合并过程中,程序会自动将日期与时间转换为对应的数字,需要借助TEXT函数来实现。
TEXT函数是用于将一个数据转换为指定格式的文本,第2个参数就是用来指定数据格式。例如“YYYY-MM-DD”,“YYYY/MM/DD”,“HH:MM”
3.将文本数据拆分成多行明细数据
要求数据有规律
将得到的数据进行转置
再进行一次分列
可以用mid函数提取分数中的数字,去掉“分”字。
mid函数是用于从字符串中提取子串的,第一个参数为字符串对象,第二个参数为起始位置,第三个参数为子串长度。
四、数据格式的转换
1.文本型数字转换为数值型
\quad
当数字显示为文本格式时,左上角会出现绿色三角形,单击左侧出现的符号,下拉菜单中单击“转换为数字”命令即可。
2.文本型日期转换为正规日期
\quad
将不规范的日期转换为规范日期,通过分列实现,注意选择按分隔符号分列而非固定宽度
五、多表合并计算
\quad
数据计算时指根据现有的数据,通过计算得到想要的结果,也可以成为数据处理或数据分析。合并计算功能就是将多个格式相同的表格数据进行求和,求平均,计数等运算,并将最终的结果显示在一张单独的表中。
\quad
上述例子中参与合并计算的数据只有一列,位置一一对应,当数据并非一一对应时,相对应的数据进行合并计算,程序也会将不对应的数据作为合并计算结果显示出来。
注意要勾选标签的位置(即根据哪些数据为合并计算的依据,该列数据相同的合并计算,无重复的也会显示)
六、数据查看
1.拆分窗口
\quad
可根据需要将窗口水平拆成两个窗口(选择某行),或垂直拆成两个窗口(选择某列),或拆成四个窗口(选择某单元格)。当然可多次拆分,每个拆分得到的窗格都是独立的,它包含所有表格信息,可任意滑动,这样对于大数据便于查看。
取消拆分的方法:将拆分条拖到边缘或者在拆分条上双击;要取消整个大窗口的拆分状态,可以单击“拆分”按钮。
2.锁定标题行
\quad
使用工作表窗口的冻结功能将标题冻结起来,以保持工作表在下滑时标题行始终可见。
注意定位的单元格位置,例如第一行为标题,则选择第二行的某单元格,以上的行会冻结,左侧的列会冻结(选择行的第一列则列不会出现冻结),此时也可以选择冻结首行。