统计分析
data_dog
创业是不可能创业了,考公又难,只能学一手数据分析打打工了,数据工程师超厉害的,说话又好听,人又实在,我超喜欢的。
展开
-
第三、四章(顾客满意度分析)
第三章顾客满意度分析 问卷形式 问卷内容变量:年龄、性别、推荐度、购物频次、交通方式。需求:受访者的性别、年龄分布 推荐度频数及均数 受访者的购物频次分布和均数 受访者使用的交通工具一、数据准备1、对年龄数值进行重编码(根据需求1需要计算年龄的均数)将年龄转为组中值(编号2的转为28.5,编号3的转为50)2、对购物频次重编码(根据需求3需要计算频数的...原创 2018-07-16 19:50:47 · 2461 阅读 · 0 评论 -
牛顿插值法和拉格朗日插值法
1、牛顿插值法转载于https://blog.csdn.net/deramer1/article/details/79037740 x = [0,1,2,3,5,6]#输入已知的x值y = [0,1,4,9,25,36]#输入已知的y值def five_order_difference_quotient(x, y): # i记录计算差商的次数,这里循环5次,计算5次...原创 2018-07-30 14:13:17 · 1736 阅读 · 0 评论 -
python时间序列(ARIMA)分析步骤
data = pd.read_excel(r'C:\Users\Administrator\Desktop\arima_data.xls',index_col = '日期')data.plot()单调递增的,不平稳单位根检验下from statsmodels.tsa.stattools import adfuller as ADFADF(data['销量'])>...原创 2018-07-31 15:57:37 · 13098 阅读 · 8 评论 -
聚类检测异常点
主要思想:用聚类方式划分数据为不同的簇,计算簇内每个点对于簇中心的相对距离(相对距离 = 点到簇中心的距离/这个簇所有点到簇中心距离的中位数),可视化后,检测出相对距离较大的点。注意是每个点到簇中心的距离的中位数,不是平均值,因为异常值对中位数的影响很小,几乎可以忽略,但是对均值的影响很大。 from sklearn import preprocessingfrom sklea...原创 2018-07-31 18:40:18 · 8666 阅读 · 3 评论