自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 资源 (1)
  • 收藏
  • 关注

转载 列式数据库有哪些?以及他们的区别是什么?

此文从收费的列数据库与互联网自行开发的列数据库进行了对比。我经常听到的列式数据库不外乎:hbasehivesybase IQ/SAPIQGreenPlum没想到,还有很多的,学习,一直需要在路上~见链接:https://www.cnblogs.com/wangtao_20/p/8294974.html...

2020-04-26 23:41:38 5701

原创 用python中的scatter函数画散点图

在学习回归分析时,遇到了这个scatter函数,故记录一下。首先引入numpy与pyplot包,然后将X与Y做个对应关系。故而,散点图呈现为下图,为正相关性。代码如下:import numpy as npimport matplotlib.pyplot as pltx = np.random.randn(1000)y = x +np.random.randn(1000)*...

2020-04-25 16:39:21 764

原创 有了决策树,为什么还需要随机森林?

决策树与随机森林,这2个概念好像经常会在一起被提起。对于小白的我来说,也是很懵。于是,我找了博文,并请教了周边的大神。得出一点通俗且易理解的小结论:决策树只有一棵树,随机森林有多棵树。决策树在生成的过程中,会给他设定前剪枝或者后剪枝,从而导致树被修剪。而随机森林由于有多棵树,也不会被修剪。在这里,我们将提供两个直观的原因,即随机森林优于单一决策树。特征空间中的分辨率更高树木未...

2020-04-25 10:53:40 1590

原创 数据行业的岗位那么多,到底这些岗位是做什么的?

数据从产生到形成资产,再到可视化,是一个漫长且有众多坑的过程。从数据预处理->数据存储->数据治理->数据模型构建->数据分析->数据挖掘->数据可视化,需要经过一系列的过程,从而也催生了众多与数据相关的岗位。

2020-04-19 11:27:37 4937 1

原创 python下求特征向量与特征值

特征向量与特征值的求解引用numpy包中linalg.eig方法进行求解。特征向量与特征值的求解,一般会应用于主成分分析方法、或LDA分类法等。import numpy as npa = np.array([[23,43],[44,55]])b = np.linalg.eig(a)b结果(array([-7.34652091, 85.34652091]), array([[-...

2020-04-19 11:11:32 1692

原创 python可视化入门之一(统计图:折线图、饼图)

import pandas as pdimport matplotlib.pyplot as plta= [3,5,6,8,80]b=[55,66,77,89,9]plt.plot(a,b)#画点plt.show()#展示

2020-04-06 23:50:43 1569

数据库工程师常见面试题.pdf

数据库工程师常见面试题.pdf 数据库工程师常见面试题.pdf

2018-04-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除