![](https://img-blog.csdnimg.cn/202108052225111.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析与数据挖掘
文章平均质量分 95
记录数据分析与数据挖掘过程中的学习笔记,包括数据提取、清理、转换、建模和可视化等。
漆比特
意疏的博客
展开
-
脑影像分析|数据分析——单个变量或多个变量与y的皮尔逊相关,同时返回r与p值(python)
皮尔逊相关是计算两个变量之间线性相关关系,或者两个向量共线程度的常用指标,应返回衡量相关程度的r值,和相关显著程度的p值。我们熟知的工具包,如pandas,numpy和scipy等,只能计算单个变量x与变量y之间的相关值,或者多个变量两两相关的相关矩阵。当我们想要分别计算多个变量X与y之间的相关关系时,就需要自己手撕代码。如果觉得手撕代码太费头发,或者对代码不怎么精通,那么就往下看吧。笔者废了好大一把头发,基于numpy和scipy撕三个函数方法,帮你快速实现多个变量与y之间的相关关系,并同时返回r和p值。原创 2022-03-29 12:47:44 · 5158 阅读 · 2 评论 -
图表可视化配色学习——自动提取图片主色调与配色方案(python、pillow、haishoku和seaborn),并生成十六进制颜色编码
无论绘制什么图表,配色方案都是非常重要的,配的好,整幅图看起来会自然美观,反之就可能很别扭。所谓的配色,笔者觉得就是一幅图表的几种主要颜色,一般绘图的工具都会提供一些调色板,供我们配色。但是工具提供的颜色色终究是比较有限的,有时我们可能需要自己配色。如果没有美术基础,自己配起来会比较难,这时我们可能需要借鉴其他的好看的图表的配色。用取色器一个一个的取色显得有些繁琐,不过最近笔者发现了一个小工具haishoku,它借助pillow获取色彩列表,可自动获取一幅图的主色调和配色方案,最多可以提取8种配色。原创 2021-10-03 20:49:00 · 3204 阅读 · 0 评论 -
Python与R共舞:在python中用ggplot2、plotnine画散点相关(回归)分析图(附最新高清plotnine、ggplot2速查表(ggplot2-cheatsheet))
虽然python有许多可视化的包,如matplotlib,seaborn,pandas等。但是笔者还是被ggplot2包绘图所吸引,图层直接简单叠加型设计,用它们可以美观简洁的构建几乎任何类型的图表。ggplot2有直接的python版本——ggplot(几年未更新,有些地方会与现在的包不兼容),plotnine(一个类似ggplot2的包,但是功能太不齐全)。考虑到ggplot2的python版本存在一些问题,加上还不能和ggplot2辅助包如ggpubr等连用,所以笔者就折腾了一下rpy2。原创 2021-09-18 14:27:59 · 3269 阅读 · 0 评论