python数据挖掘与分析实战第四章数据预处理_《Python数据挖掘与机器学习实战》—3.4.2 分析数据...

3.4.2  分析数据

分析数据的特征:

TV:在电视上投资的广告费用(以千万元为单位);

Radio:在广播媒体上投资的广告费用;

Newspaper:用于报纸媒体的广告费用;

响应:连续的值;

Sales:对应产品的销量。

在这个案例中,通过不同的广告投入,预测产品销量。因为响应变量是一个连续的值,所以这个问题是一个回归问题。数据集一共有200个观测值,每一组观测对应一个市场的情况。

?注意:这里推荐使用的是seaborn包。这个包的数据可视化效果比较好。其实seaborn也属于Matplotlib的内部包,只是需要单独安装。

import seaborn as sns

import matplotlib.pyplot as plt

# 使用散点图可视化特征与响应之间的关系

sns.pairplot(data, x_vars=['TV','Radio','Newspaper'], y_vars='Sales',

size=7, aspect=0.8)

plt.show()                                                               #注意必须加上这一句,否则无法显示

#这里选择TV?Radio?Newspaper 作为特征,Sales作为观测值

seaborn的pairplot函数绘制X的每一维度和对应Y的散点图。通过设置size和aspect参数来调节显示的大小和比例。通过加入一个参数kind='reg'&#

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值