自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

转载 特征提取与特征选择

一.特征提取和特征选择的区别特征选择和降维(特征提取)有着些许的相似点,这两者达到的效果是一样的,就是试图去减少特征数据集中的属性(或者称为特征)的数目;但是两者所采用的方式方法却不同:降维的方法主要是通过属性间的关系,如组合不同的属性得到新的属性,这样就改变了原来的特征空间;而特征选择的方法是从原始特征数据集中选择出子集,是一种包含的关系,没有更改原始的特征空间。二.常用的特征选择方法有哪些...

2020-03-06 12:05:36 941

原创 统计学总结

一、离散型概率分布和连续型概率分布离散型概率分布求随机变量x取某个特定值的概率.(1)二项分布成立条件:每次试验成功的概率均是相同的,记录为p;失败的概率也相同,为1-p。每次试验必须相互独立,该试验也叫做伯努利试验,重复n次即二项概率。公式:(2)泊松分布成立条件: 在任意两个长度相等的区间中,时间发生的概率是相同的,并且事件是否发生都是相互独立的。x代表发生x次,u代...

2019-11-30 12:07:58 2031

原创 集成学习

一、构建组合分类器的好处(1)提升模型精度:整合各个模型的分类结果,得到更合理的决策边界,减少整体错误呢,实现更好的分类效果;(2)处理过大或过小的数据集:数据集较大时,可将数据集划分成多个子集,对子集构建分类器;当数据集较小时,通过自助采样(bootstrap)从原始数据集采样产生多组不同的数据集,构建分类器。(3)若决策边界过于复杂,则线性模型不能很好地描述真实情况。因此,现对于特定区域...

2019-11-30 10:20:52 459

原创 统计检验两类错误

1.两类错误解释1.假设检验的最终目的是:去伪存真,那么它对应的两类错误是弃真、存伪。H0:原假设(无明显差异,正常情况大概率事件),H1:备选假设,原假设不成立时的替换第一类错误(α),Ⅰ型错误,拒绝了实际上成立的H0 ,即错误地判为有差别。α取0.05,表示当拒绝H0时则理论上理论100次检验中平均有5次发生这样的错误。第二类错误(β),Ⅱ型错误,接受了实际上不成立的H0 ,也就是错...

2019-11-03 13:09:13 5900

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除