目录
1.数据缘何而来
excel文件格式:xls或xlsx
1.1 了解excel
1)文件:工作簿、工作表、单元格(单元格地址:先有列后有行)
2)工具栏:文件、开始、插入、页面布局、公式、数据、审阅、视图、帮助、第三方插件
在Excel中导入第三方插件,可以点击文件
–>选项
–>自定义功能区
点击右侧的√,即可导入相关模块
1.2 excel的存储格式
1)常用的存储类似分别是xlsx、csv以及txt,一般情况下,csv文件采用是逗号分隔,txt文件采用的是制表符作为分隔;特殊的情况下,数据的分隔符合可能不是常规的分隔符合,如 |
2)用excel打开:数据–>获取和转换数据–>从文件/CSV,点击加载
3)注意:此时构建的数据表跟原始数据是存在连接关系,更改csv文件的数据后在点击路径:设计-外部表数据-刷新后就可以更新工作表数据。如果要取消链接关系则点击路径:设计-外部数据表-取消链接即可
2.excel数据格式
2.1 单元格数据格式
一共11种,常见的数据类型有3种分别是数字、文本和日期
2.1.1数字
1)12位数的时候会以科学计数法显示
2)真假数字:真数值默认情况下是右对齐,假数值是数值型文本属于文本,左上角会有个绿色三角错误检查,当数据是文本时,无法完成数字运算操作
数据纠错:点击黄色感叹号,将文本转出数字,或者使用=VALUE()
函数将文本转成数字
2.1.2 日期
1)标准日期:由年月日组成的数据,例如2021/1/1
2)在Excel里面日期最早是1900年1月1日,对应的数值为1,通过两日期相减可以得到日期相差的天数
3)注意:如果是2021-01-01
的数据就要看是否实际数据为'2021/1/1'
,否则为文本型日期,需要进行转换才行
2.2 单元格格式
1)设置单元格格式:①点击单元格后,右键-设置单元格格式选项 ②按快捷键 ③开始-数字
2)可以设置的格式类型包括:①数字:调整数值格式或者日期格式。②对齐:调整对齐方式。③字体:更改字体、字型、字号等。④边框:单元格边框设置。⑤填充:填充单元格背景颜色,标注数据经常使用。⑥保护:锁定单元格或者隐藏公式。
2.2.1 数值格式
小数点保留两位,数值对齐,使用千分位分隔符能更容易观察数值大小
2.2.2 文本格式
用于对文本进行加单引号、双引号或者逗号的情况
2.2.3 日期格式
1)调整日期格式为年-月-日
2)需要注意的是文本型的日期格式无法调整,而数值是可以调整为日期
2.3 转换单元格数据
1)数值和文本、日期和文本相互转换:数据–>分列–>对应的类型操作
2)文本类型转换,如果通过设置单元格格式来改变的话,显示的还是文本类型,但实际类型已改变
3.练习
1.使用Excel数据导入功能,完成data/chap1/Titanic_normal.csv
和data/chap1/Titanic_special.txt
数据导入
数据–>从文本/CSV
2.完成data/chap1/2.1.xlsx
中案例1-4中的问题
案例1:数据求和:转换成数字–>sum函数
案例2:使用day函数提取日期:①数据–>分列–>日期:YMD②=day()③开始–>数字:常规
案例3:日期转换成文本:数据–>分列–>文本
案例4:将不规范的日期转成规范的year/month/day 形式:数据–>分列–>日期:MDY