自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

花与花

数据搬运工

  • 博客(9)
  • 资源 (3)
  • 收藏
  • 关注

原创 数据分析方法-聚类算法

文章目录一、定义二、聚类、分类区别分类聚类常用算法一、定义聚类(Clustering)就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组,而这些相似组被称作簇。处于相同簇中的数据实例彼此相同,处于不同簇中的实例彼此不同。数据之间的相似性是通过定义一个距离或者相似性系数来判别的。二、聚类、分类区别分类分类聚类是一种有监督式的学习过程是一种无监督式的学...

2019-12-30 16:54:08 3596

原创 数据分析统计学基础一

文章目录数据分析方法分类1、单纯的数据加工方法2、基于数理统计的数据分析方法3、基于数据挖掘的数据分析方法4、基于大数据的数据分析方法数据分析方法分类1、单纯的数据加工方法a.描述性统计分析(集中、离中趋势分析和数据分布)b.相关性分析2、基于数理统计的数据分析方法方差分析、回归分析(特指一元线性回归)、因子分析3、基于数据挖掘的数据分析方法a.聚类分析b.分类分析(决策树、人工神经...

2019-12-30 14:32:42 1410

原创 数据分析-书籍整理(一)

入门书籍《谁说菜鸟不会数据分析》讲解了一些常见的分析技巧,并附带 Excel 的一些知识以及职场可使用的基础数据分析。《MYSQL必知必会》对于有sql基础的人来说,可以快速复习知识点,小白也能学习到很多,不会打击自信心。我是用来做复习的,边看边做习题。《从零进阶,数据分析的统计基础》这个书做的纸质版笔记,便于自己加深印象,有需要可私聊。...

2019-12-29 10:39:55 229

原创 数据分析方法--回归分析方法((SPSS建模:多元线性回归案例)

文章目录回归定义最常用回归方法一、线性回归(Linear Regression)二、逻辑回归(Logistic Regression)回归定义回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。最常用回归方法一、...

2019-12-28 22:21:46 23805 2

原创 Anaconda3使用过程中遇到的问题

文章目录数据可视化中文、负号显示数据可视化中文、负号显示在导入包时,将这段代码也写上:plt.rcParams['font.sans-serif']=['SimHei'] #显示中文plt.rcParams['axes.unicode_minus']=False #允许显示负数...

2019-12-28 11:07:47 507

原创 空气质量指数(AQI)分析与预测

前言近年来,空气质量问题日益严峻,备受关注。对收集的有关空气质量指数相关的数据进行一个简单的分析。一、背景Ⅰ数据来源数据来源于网络,数据下载,提取码:lrm8Ⅱ 数据背景该数据集是指2015年某些城市数据, 包含全国主要城市的相关数据及空气质量指数,其包含326个样本以及12个特征, 这10个特征分别为: 城市,空气质量指数,降雨量,城市生产总值,温度,经度,纬度,海拔高度,人口密度,...

2019-12-27 23:04:28 19422 47

原创 数据分析-书籍整理(二)

业务书籍《数据化管理-洞悉零售及电子商务》讲解了关于零售和电商的一些知识,有很多实用案例。《游戏数据分析实战》游戏各个阶段的数据分析,方法,数据来源,案例等。《增长黑客》这本书我看了两遍,每次都有新收获,也有一些想法,但是都还是理论,需要进行实践操作才能知道是否实际。这个导图是来自网上,别人的比较详细。侵删...

2019-12-27 16:20:25 251

原创 CDNOW用户消费行为分析报告(python+ppt)

2019-12-16 22:27:45 545 1

原创 在线销售数据分析–人货场三维分析角度

@在线销售数据分析–人货场三维分析角度一、数据来源及理解此次分析数据来源于第二届Power BI 可视化大赛样例数据,共有四个表,分别为sales,store,item,district,一共有七十万左右的数据。二、分析思路按照人-货-场三维分析角度进行分析,分析导图:三、数据处理数据预处理整个数据包括四张表,三十九个不同字段,但在实际分析过程中我们只用到了十五个字段,为了让数据分...

2019-12-15 14:33:05 16738 4

常用汉字及生僻字(可搭配Jieba分词使用)

列举出常用的汉字3550个,还有生僻字

2021-07-09

常用中文停用词表(常用四份停用词表进行了合并去重)

中文停用词表, 哈工大停用词表, 百度停用词表, 四川大学机器智能实验室停用词库四份停用词表进行了合并去重

2021-07-09

PowerBI星球TABLEAU星球-数据集.zip

POWERBI数据集打包,里面有各种数据集可以下载来做POWERBI实战练习,还有部分tableau数据集提供下载

2020-04-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除