- 博客(6)
- 资源 (1)
- 收藏
- 关注
转载 列式数据库有哪些?以及他们的区别是什么?
此文从收费的列数据库与互联网自行开发的列数据库进行了对比。我经常听到的列式数据库不外乎:hbasehivesybase IQ/SAPIQGreenPlum没想到,还有很多的,学习,一直需要在路上~见链接:https://www.cnblogs.com/wangtao_20/p/8294974.html...
2020-04-26 23:41:38 5701
原创 用python中的scatter函数画散点图
在学习回归分析时,遇到了这个scatter函数,故记录一下。首先引入numpy与pyplot包,然后将X与Y做个对应关系。故而,散点图呈现为下图,为正相关性。代码如下:import numpy as npimport matplotlib.pyplot as pltx = np.random.randn(1000)y = x +np.random.randn(1000)*...
2020-04-25 16:39:21 764
原创 有了决策树,为什么还需要随机森林?
决策树与随机森林,这2个概念好像经常会在一起被提起。对于小白的我来说,也是很懵。于是,我找了博文,并请教了周边的大神。得出一点通俗且易理解的小结论:决策树只有一棵树,随机森林有多棵树。决策树在生成的过程中,会给他设定前剪枝或者后剪枝,从而导致树被修剪。而随机森林由于有多棵树,也不会被修剪。在这里,我们将提供两个直观的原因,即随机森林优于单一决策树。特征空间中的分辨率更高树木未...
2020-04-25 10:53:40 1590
原创 数据行业的岗位那么多,到底这些岗位是做什么的?
数据从产生到形成资产,再到可视化,是一个漫长且有众多坑的过程。从数据预处理->数据存储->数据治理->数据模型构建->数据分析->数据挖掘->数据可视化,需要经过一系列的过程,从而也催生了众多与数据相关的岗位。
2020-04-19 11:27:37 4937 1
原创 python下求特征向量与特征值
特征向量与特征值的求解引用numpy包中linalg.eig方法进行求解。特征向量与特征值的求解,一般会应用于主成分分析方法、或LDA分类法等。import numpy as npa = np.array([[23,43],[44,55]])b = np.linalg.eig(a)b结果(array([-7.34652091, 85.34652091]), array([[-...
2020-04-19 11:11:32 1692
原创 python可视化入门之一(统计图:折线图、饼图)
import pandas as pdimport matplotlib.pyplot as plta= [3,5,6,8,80]b=[55,66,77,89,9]plt.plot(a,b)#画点plt.show()#展示
2020-04-06 23:50:43 1569
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人