自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 make_blobs函数

make_blobs函数是为聚类产生数据集产生一个数据集和相应的标签n_samples:表示数据样本点个数,默认值100n_features:表示数据的维度,默认值是2centers:产生数据的中心点,默认值3cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)shuffle :洗乱,默认值是Truerandom_state:官网解释是随机生成器的种子链接:https://www.jia.

2021-04-04 10:10:08 4163

原创 One-hot编码

处理分类数据(有限个字符型的数据)方法:1.删除非数值型数据(也就是这些分类数据)drop(object);2.标签编码;from sklearn.preprocessing import LabelEncoderlabel_encoder=LabelEncoder()label_encoder.fit([])(拟合)label_encoder.transform([])(转化)//fit_transform()3.独热编码。独热编码:对分类(类别)数据:使用标签编码包含了标签的大小关系

2021-03-27 11:06:44 139

原创 卡方检验思想

**卡方检验思想总结卡方检验思想:1.假设数据服从某种分布,或某种模型;2.计算出符合此模型的数据,即为期望数据;3.实际观测到的数据和2中计算得到的期望数据相比较(卡方检验的公式);4.得到的卡方值过大,说明偏差过大,则拒绝假设模型。卡方检验适用于类别变量 ,如好、坏等分类。卡方检验公式:χ²=∑(Oi-Ei)²\Ei自由度:df=(row-1)(column-1)什么是自由度:自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数。卡方表:row-df

2021-03-26 17:21:11 2153

转载 Hadoop MapReduce框架详解

Hadoop MapReduce框架详解mapreduce是hadoop的计算框架,就感觉到hdfs和mapreduce关系的紧密。学习某一套技术总是想着这套技术到底能干什么,只有当我真正理解了这套技术解决了什么问题时候,我后续的学习就能逐步的加快,而学习hdfs时候我就发现,要理解hadoop框架的意义,hdfs和mapreduce是密不可分。Mapreduce初析Mapreduce是一个计算框架,既然是做计算的框架,那么表现形式就是有个输入(input),mapreduce操作这个输入(input

2020-05-14 20:53:43 210

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除