EXCEL与数据分析

EXCEL与数据分析

1.EXCEL数据获取

①数据导入
录入方式
从文件导入支持txt,xml,csv等文本文件;数据对齐或者拥有分隔符,均能很好的导入
从数据库支持自家公司的Access数据库,SQL Server数据库
从网页加载可获取大多数网站网页数据,需进一步进行数据清洗
②数据快速录入
  • 用于快速填充的自定义列表
  • 填充柄快速填充+[ 右键菜单辅助]
  • CTRL + ENTER 多表格快速录入
  • 针对重复文本录入:右键菜单: ‘从下拉列表选择’
  • 录入区域构建数据验证:序列
  • 自定义数据格式:以简代繁,ex. [=1]“男”;[=0]“女” 以0,1代替实现快速录入
  • 以宏VBA来替换重复性动作

2.EXCEL数据清洗

数据清洗
定位条件定位:空值,公式,差异值,条件格式,数据验证等,快速定位空值,异常值,进行处理
查找替换定向替换数据 ,使用时需确认是否需要 ‘单元格匹配’
选择性粘贴可选择性粘贴数据;粘贴过程进行运算;跳过空值,行列转置
数据分列通过步长,分隔符进行分列
数据类型转换主要是文本与数值型转换,日期格式标准化

文本转换为数值常用方式:

  • = A1 * 1
  • = A1 / 1
  • = A1 + 0
  • = A1 - 0
  • = – A1
  • =VALUE(A1)

3.EXCEL数据分析

分析方式
合并计算多工作表字段一致时,可以进行合并计算进行汇总
组合功能键ALT+=: 汇总数据;CTAL+SHIFT+方向键 : 快速选中数据; SHIFT+F8: 开启‘添加选定模式’
函数公式数学函数,统计函数,日期函数,文本函数,逻辑函数,查询函数
数组,数组公式基于数组的快速运算Ctrl+Shift+Enter

常用函数:

统计函数数学函数日期函数文本函数逻辑函数查询函数
max,min,average,sumabs(number)取绝对值now()当前日期时间text(format,“your format”)格式化if(logical_test,true,false)column()列号
count(value1,value2…)计数int(number)取整today()当前日期len(text)字符个数and(logical1,logical2…)row()行号
counta(value1,value2…)计数非空mod(number,divisor) 取模year(serial_number)取年rept(text,num_times)重复文本or(logical1,logical2…)index(range,row,column)返回单元格内容
countif(criteria_range,criteria)条件计数rand()随机数0~1month(serial_number)取月find(find_text,within_text,start_num)查询字符位置not(logical)offset(基点,行偏,列偏,行高,列高)范围取值
countifs(criteria_range1,criteria1,criteria_range2,criteria2…)多条件计数randbetween(m,n)随机数m~nday(serial_number)取日choose(index,value1,value2…)根据index返回valueindirect(‘str’)字串引用
sumif(range,criteria,sum_range)条件求和round(number,num_digits)四舍五入date(year,month,day)合成日期序列left(text,num_chars)左取字符sumproduct(array1,array2…)数组乘积和
sumifs(sum_range,criteria_range1,criteria1,criteria_range2,criteria2…)多条件求和roundup((number,num_digits))向上舍入edate(start_date,months)right(text,num_chars)右取字符lookup(1,0/(array1*array2…),array)
frequency(data_arry,bins_arry)分段求频率rounddown(number,num_digits)向下舍入eomonth(start_date,months)月最后一日mid(text,start_num,num_chars)取字符vlookup(str,array,n,0/1)列查询
rank(number,ref,order)排名datedif(start_date,end_date,unit)计算日期差replace(old_text,start_num,num_chars,new_text)替换hlookup(str,array,n,0/1)行查询
large(array,k)第k大的数substitute(text,old_text,new_text,instance_num)替换指定字符match(str,range,0/1)返回目标位置
small(array,k)第k小的数

常用计算函数:

LN(number)计算自然对数
MDETERM(array)计算方阵行列式
MINVERSE(array)矩阵求逆
MMULT(array,array)矩阵积
MULTINOMIAL(number1,number2,…)多项式回归
MUNUIT(dimension)生成指定维度单位矩阵
SQRT(number)平方根
统计专用函数

快捷功能:
Excel提供的快捷排序,筛选。数据透视表功能。

4.EXCEL数据挖掘

1.数据概括性度量:
集中趋势:

众数: Mo = mode(array) 计算一组数值型数据的众数。
中位数和分位数:Me = median(array) 计算一组数值型数据的中位数。
四分位数 QL = quartile(array, quart) 计算一组数值型数据的众数。(0,1,2,3,4)
平均数:平方平均数≥算术平均数(简单平均,加权平均)≥几何平均数≥调和平均数

5.EXCEL数据展示

excel通过:数据透视表+图表进行可视化展示,通过增加切片器使展示实现动态化。
分类数据图示
条形图(纵置也称柱形图):适用于数据对比
帕累托图:柱形各类占比,折线累积百分比。 市场占有率较为适用。
饼图(复式饼图):分类对比
环形图(多环):饼图升级版,同时展示不同feature的分类占比

数值型数据图示:
茎叶图:用于反映原始数据分布的图形,适用小量数据观察 (Excel不支持,SPSS可绘制)
箱线图:用于观察数据分布,及异常值筛查 (Excel不支持,SPSS可绘制)

直方图:主要用于展示分组数据,用面积来表示频率分布
线图:时间序列数据,常用,反映现象随时间的变化的特征
散点图:展示数据2个特征数据
气泡图:展示数据3个特征数据,(加上颜色可展示4个特征)
雷达图(蜘蛛图):展示数据n个特征数据

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

无尽渊源

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值