【Python】学习笔记1

写下来以便自己记忆。

描述性统计方法:首先判断变量的类型,一个分类变量计算统计量、频次value_counts,用直方图;两个分类标准化堆叠柱形图crosstab,统计检验用卡方检验;一个分类一个连续变量用groupby分类盒须图boxplot,统计检验用两样本T检验(多分类则用方差分析);两个连续变量pivot透视表散点图,统计检验用相关分析(注意相关分析和回归分析不同,相关分析用来确认变量是否有关系,回归分析是已经确认有关系后再确认变量间是什么函数关系).

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import os
os.chdir(r'F:\Download\中文名')
#文件名中有中文,不能直接读取,需要分两步
trad_flow=pd.read_csv("RFM_TRAD_FLOW.csv",encoding='gbk')
trad_flow.head(10)
F=trad_flow.groupby(['cumid','type'])[['transID']].count()
F.head()
#%%透视图 两个分类一个连续
F_trans=pd.pivot_table(F,index='cumid',columns='type',values='transID')
F_trans.head()
#%%缺失值处理
F_trans['Special_offer']=F_trans['Special_offer'].fillna(0)
F_trans["interest"]=F_trans[
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值