数据相关性分析笔记

一、数据相关性的含义

数据类型
数据可以是连续的值,比如声音、图像,称为模拟数据。也可以是离散的,如符号、文字,称为数字数据。(ppt)数值型数据、分类型数据、定序数据。
数据相关性
数据相关性是指数据之间存在某种关系,如正相关,负相关。(ppt)是研究两个或两个以上处于同等地位的随机变量间的相关关系的统计分析方法,是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。

二、数据相关性的应用

例如:商业
某服装电商商家想通过商品相关关键字的搜索数量来预测商品的销量,现在该商家有一批商品相关关键字的历史搜索数量和销量。
未来,该商家想通过一些关键字的实时搜索数量来决定开发哪些新产品。是否可以通过关键字搜索量来预测商品销量呢?

三、数据相关性定性分析

定性判断趋势,定量决定细节。
例如:
2x=4
定性:x>0 定量:x=2
既然是判断趋势,那么可以通过折线图、散点图等进行数据相关性的定性分析。在这里插入图片描述

四、数据相关性定量计算

举例

import seaborn as sns
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
tips = sns.load_dataset("tipss")#加载给小费数据 吸烟1 不吸烟0 男1 女0
print(tips.head(5))
X = tips['sex']
Y = tips['smoker']
result1 = np.corrcoef(X, Y)
print(result1)
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值