![](https://img-blog.csdnimg.cn/20190918140012416.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
统计分析与挖掘
文章平均质量分 81
基于python的统计学部分知识和数据挖掘算法的应用
ryo007gnnu
这个作者很懒,什么都没留下…
展开
-
使用tushare数据画疫情感染人数地图
通过提取tushare疫情数据,画世界和中国地图。原创 2022-12-22 17:50:25 · 575 阅读 · 1 评论 -
决策树分类——附数据下载
又在网络上搜罗了几个,凑了几个决策树的例子,原理的部分直接略去,说白了就是原创 2021-10-06 20:59:52 · 5237 阅读 · 3 评论 -
因子分析——附数据下载
因子分析的主要目的是用来描述隐藏在一组测量到的变量中的一些更基本的,但又无法直接测量到的隐性变量 。与主成分分析相似,因子分析也具有降维的功能,但与主成分分析不同之处在于,因子分析是对主成分分析的扩展,提取出的公因子不仅考虑变量之间的相关性,还考虑了变量之间相关性的强弱,因此更容易解释其代表的含义。本文从网络上搜集了三个案例,对这些案例进行了整理,主要目的是为了说明因子分析的步骤,更容易看懂。数据下载在此(一个工作表是一份数据)因子分析步骤:(1)数据导入,进行KMO和Bartlett球形检验,判断是原创 2021-10-02 21:36:11 · 7052 阅读 · 37 评论 -
解决seaborn数据无法导入的问题
使用seaborn进行绘图时,可能会发现数据导入的load_dataset出现无法导入的现象:原因大家都解释的很清楚了,是因为外网无法直接连接的问题。这里我们直接说解决方案:load_dataset的数据源是https://github.com/mwaskom/seaborn-data我们需要先将数据源的数据下载下来,方法也比较简单,先进入该数据源页面然后选择Download ZIP,将这个项目打包下载,下载完毕后,将这个压缩包解压后放在我们默认的目录下就好了(windows默认的是User)。原创 2021-02-04 17:36:07 · 2649 阅读 · 6 评论 -
用统计分析包和机器学习包做回归分析
今天来说说简单的线性回归,分别是用统计分析包statsmodels和机器学习包sklearn,数据来源是回归数据。这个例子网上已经写烂了,大家可以自行搜索看看。某公司在多个媒体渠道上发布了广告,业务人员想了解各媒体的广告费用对产品销售额的影响程度到底如何。数据结构如下所示:首先做个相关系数矩阵,看看是不是有相关关系:import pandas as pddata=pd.read_csv(r'回归.csv')data.corr()看上去,sales和其他变量都有那么些关系,感觉TV与sal原创 2020-10-22 16:21:19 · 215 阅读 · 0 评论