数据分析

本文详细探讨了数据分析的关键步骤,包括数据预处理、探索性数据分析、建模以及结果解释。通过实例展示了如何利用Python库进行数据清洗、特征工程和可视化,同时讨论了常用的统计模型及其在业务决策中的应用。
摘要由CSDN通过智能技术生成
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline
plt.style.use('ggplot')

columns = ['UID','order_dt','product','amount']
df = pd.read_csv(r'C:\Users\think\Desktop\CDNOW_master.txt',encoding = 'gb2312',names = columns, sep='\s+')
df.head()

df.describe()
df['date'] = pd.to_datetime(df.order_dt,format='%Y%m%d')
df['month'] = df.date.values.astype('datetime64[M]')
df.head()
user_group = df.groupby('UID').sum()
user_group.head()
user_group.describe()


df.groupby('month').amount.sum().plot()   #默认plot()为折线图;根据哪个指标聚合、图表呈现哪个指标、统计方式如何、选用哪个类型图表

df.groupby('UID').sum().plot.scatter(x='amount',y='product') #选择不同的数据呈现形式 plot.+图表函数
plt.figure(figsize=(12,4))  #设置一个宽12ÿ
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值