python画相关性可视化图上三角_Python数据处理从零开始----第四章(可视化)(9)线性相关曲线...

通过python我们可以绘制两个变量的相关图,我所使用的是皮尔森相关,主要的参数是:①r相关系数②P值。一般对P值的评判标准是P< 0.05简单的相关系数的分类

0.8-1.0 极强相关

0.6-0.8 强相关

0.4-0.6 中等程度相关

0.2-0.4 弱相关

0.0-0.2 极弱相关或无相关

r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值也会越大;若r<0,表明两个变量是负相关,即一个变量的值越大另一个变量的值反而会越小。r 的绝对值越大表明相关性越强,要注意的是这里并不存在因果关系。

基础拟合曲线绘制# -*- coding: utf-8 -*-"""

Created on Mon Nov 19 00:57:53 2018

@author: czh

"""# In[*]#导入各种需要的包#import numpy as npimport matplotlib.pyplot as pltfrom scipy import optimizeimport seaborn as sns

sns.set()# In[*]import seaborn as sns

sns.set(style="darkgrid")

tips = sns.load_dataset("tips")

g = sns.jointplot("total_bill", "tip", data=tips, kind="reg",

xlim=(0, 60), ylim=(0, 12), color="m", height=7)

这是通过python语言绘制的线性相关曲线拟合图,感觉比R语言在代码上更简洁,且图片能展示的信息更多。

多分组拟合曲线绘制# -*- coding: utf-8 -*-"""

Created on Mon Nov 19 00:57:53 2018

@author: czh

"""# In[*]#导入各种需要的包#import numpy as npimport matplotlib.pyplot as pltfrom scipy import optimizeimport seaborn as sns

sns.set()# In[*]# Load the iris datasetiris = sns.load_dataset("iris")# Plot sepal with as a function of sepal_length across daysg = sns.lmplot(x="sepal_length", y="sepal_width",hue='species',

truncate=True, height=5, data=iris)# Use more informative axis labels than are provided by defaultg.set_axis_labels("Sepal length (mm)", "Sepal width (mm)")

多变量子图拟合曲线绘制# -*- coding: utf-8 -*-"""

Created on Wed Dec 26 11:17:56 2018

@author: czh

"""%reset -f

%clear# In[*]from matplotlib import pyplot as pltimport numpy as npimport pandas as pdimport lifelines as llfrom IPython.display import HTML

%matplotlib inlineimport matplotlib.pyplot as pltimport seaborn as snsimport plotly.plotly as pyimport plotly.tools as tls

from plotly.graph_objs import *import osfrom scipy import statsfrom lifelines.estimation import KaplanMeierFitter

kmf = KaplanMeierFitter()from lifelines.statistics import logrank_testfrom sklearn.preprocessing import StandardScaler

os.chdir("D:\\Rwork\\third\\Fig2")# In[*]# Import Datadf = pd.read_csv("https://raw.githubusercontent.com/selva86/datasets/master/mpg_ggplot2.csv")

df_select = df.loc[df.cyl.isin([4,8]), :]# Each line in its own columnsns.set_style("white")

gridobj = sns.lmplot(x="displ", y="hwy",

data=df_select,

height=7,

robust=True,

palette='Set1',

col="cyl",

scatter_kws=dict(s=60, linewidths=.7, edgecolors='black'))# Decorationsgridobj.set(xlim=(0.5, 7.5), ylim=(0, 50))

plt.show()

作者:赛乾

链接:https://www.jianshu.com/p/c53fe1ad15be

x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值