Ctrl+S,快读保存,你懂的。
Ctrl+Z,撤回当前操作。
如果是效率达人,可以学习更多快捷键。Mac用户的ctrl一般需要用command替换。
格式转换
YYYY代表通配的四位数年格式
MM代表通配的两位数月格式
DD代表通配的两位数日格式
HH代表通配的的两位数小时(24小时)格式
hh代表通配的两位数小(12小时制)格式
mm代表通配的两位数分格式
ss代表通配的两位数秒格式
例如2018/03/16可以写成:yyyy/MM/dd
2018-03-16 23:59:59可以写成:yyyy-MM-dd HH:mm:ss
数组
分列
Excel可以将多个单元格的内容合并,但是不擅长拆分。分列功能可以将某一列按照特定规则拆分。常常用来进行数据清洗。
上文我有一列地区的数据,我想要将市和区分成两列。通常做法是可以用mid和find函数查找“市”截取字符。但最快做法就是用“市”分列。
出一个思考题,如果市和区都存在应该如何分列?
SQL和Python中有类似的spilt ( )函数。
合并单元格
单元格作为报表整理使用,除非是最终输出格式,例如打印。否则不要随意合并单元格。
一旦使用合并单元格,绝大多数函数都不能正常使用,影响批量的数据处理和格式转换。合并单元格也会造成Python和SQL的读取错误。
数据透视表
聚合功能有一点类似SQL中的gorup by,python中则有更为强大的pandas.pivot_table( )。
删除重复项
一种数据清洗和检验的快速方式。想要验证某一列有多少个唯一值,或者数据清洗,都可以使用。
功能类似SQL中的distinct ,python中的set。
条件格式
条件格式可以当作数据可视化的应用。如果我们要使用函数在大量数据中找出前三的值,可能会用到rank( )函数,排序,然后过滤出1,2,3。
用条件格式则是另外一种快速方法,直接用颜色标出,非常直观。
冻结首行首列
Excel的首行一般是各字段名Header,俗称表头,当行数和列数过多的时候,观察数据比较麻烦。我们可以通过固定住首行,方便浏览和操作。
Header是一个较为重要的概念。在Python和R中,read_csv函数,会有一个专门的参数header=true,来判断是否读取表头作为columns的名字。
数据有效性
数据有效性是一种约束,针对单元格限制其输入,也就是让其只能固定几个值。下拉菜单是一种高阶应用,通过允许下拉箭头即可。
自定义名称
自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经常使用的话,直接引用即可,无需再次定位。这是复用的概念。
我们将A1:A3区域命名为NUM。
直接使用=sum(NUM) ,等价于sum(A1:A3)。
分组和分级显示
分析工具库
分析工具库是高阶分析的利器,包含很多统计计算,检验功能等工具。Excel是默认不安装的,要安装需要加载项,在工具菜单下(不同版本安装方式会有一点小差异)。
分析工具库是统计包,规划求解是计算最优解,类似决策树。这两者的分析方法以后详细论述。
Mac似乎有阉割。
第三方应用
Excel是支持第三方插件的,第三方插件拥有非常强大的功能。甚至完成BI的工作。
应用商店里微软官方的Power系列都挺好。下图就是Power Map。
第三方应用商店Mac没有,非常可惜。Win用户请用最新版本,2010以前是没有插件的。第三方应用是可以深学的,如果是传统行业的数据分析师,需要专注学习,互联网分析就不需要了。
学习更多知识·长按图片订阅
▼
点击,查看更多爆款课程。