给面试官讲特征选择

最新推荐文章于 2024-09-30 12:06:46 发布

本堂町小春

最新推荐文章于 2024-09-30 12:06:46 发布

阅读量161

点赞数

分类专栏：给面试官讲机器学习文章标签：深度学习机器学习

本文链接：https://blog.csdn.net/qq_40253497/article/details/104870531

版权

给面试官讲机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

特征选择

1. 意义

降维，减少计算量
特征优选，降低模型复杂度，符合“奥卡姆剃刀”原理

2. 方法

去除变化较小的特征
方差选择法：选择方差较大的特征
PCA降维，同时可以去特征间耦合
皮尔逊相关度：选取互相独立的标签
根据可分性判据：类内类间距离、概率分布、信息熵等，每次单独计算各个特征的可分性判据，选前m个
互信息系数
L1正则化，Lasso回归
树模型，根据平均不纯度减少值划分，算出每个特征对不纯度减少的贡献（缺点：对先选的特征先降低，并不一定后选的就不如先选的重要，因此要多次取平均）
随机森林随机列采样，集成学习
gdbt、xgb进行特征组合，对叶子节点的类别编码（真实类别所属叶子节点编1，其余编0），后接LR继续训练（CTR常用）
embdding，深度学习、NLP中常用，通过全连接组合特征，输出为两层间的参数值
最优选择算法，从M个中选n个，枚举C(n,M)种可能性
SFS：每次从剩下的特征里选一个最优的
SBS：第一次选全部特征，每次剔除一个最差的
LR：结合SFS和SBS
遗传算法：每次选一批优选特征，进行交叉和变异，直至收敛

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

本堂町小春

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

机器学习面试--特征选择

D3d的博客

07-08

584

机器学习面试之特征选择方法一、特征选择的目标构造机器学习的模型的目的是希望能够从原始的特征数据集中学习出问题的结构与问题的本质，此时的挑选出的特征就应该能够对问题有更好的解释；特征决定了机器学习的上限，而模型和算法只是去逼近这个上限，所以特征选择的目标大概如下：提高预测的准确性构造更快消耗更低的预测模型能够对模型有更好的理解和解释二、特征选择的方法一般来说特征选择都是从两个方...

特征选择和特征提取

weixin_34306593的博客

10-18

1136

参考文献1：PCA的数学原理（讲得极好）参考文献2：《机器学习导论》题外话：　　　　上次，参加国内业界最牛逼之一的格林深瞳的笔试和面试，没想到竟然都通过了。高兴之余，实际上，还有很长的路要走。　　说实话，也是有点幸运，出了很多毕设相关的视觉知识。毕设做得很认真，然后面试时，我自然和面试的那位年轻小伙讲得滔滔不绝。但是第二关是相关的机器学习和深度学习的知识。机器学习我能答上，深...

参与评论您还未登录，请先登录后发表或查看评论

常用的特征选择方法

Alien_lily的博客

10-18

788

特征选择主要有两个功能：减少特征数量、降维，使模型泛化能力更强，减少过拟合增强对特征和特征值之间的理解去掉取值变化小的特征假如说头一个特征值只有0和1，并且在所有的输入样本中，95%以上的取值都是0，那其实我们可以认为这个特征作用不大，可分析性不大没啥意义。一般会把它作为特征选择的预处理，先去掉那些取值变化小的特征，然后再从接下来提到的特征选择方法中选择合适的进行进一步的特征选择。单变量...

面试（6）：特征选择与特征提取（降维）

小蜗牛的博客

07-13

6866

特征选择与特征提取（降维）1、相同点与不同点2、特征选择2.1 过滤型（Filter）2.2 包裹型（Wrapper）2.3 嵌入型（Embedded）3、特征提取（降维）3.1 主成分分析法（PCA）3.2 线性判别分析法（LDA） 1、相同点与不同点相同点：特征选择和特征提取二者达成的效果相似，都是试图减少数据集中属性（特征）的数量，找出最有效（同类样本的不变性、不同样本的鉴别性、对噪声的...

秋招总结问题一：为什么需要特征选择？特征选择有哪些？

qq_19645269的博客

10-09

4008

1.为什么需要特征选择？特征选择有哪些？第一个问题：①在现实任务中经常会遇到维数灾难问题，属性过多造成的。 ②可以降低学习任务的难度。不相关的特征就是噪声。第二个问题：过滤式，包裹式，嵌入式 特征选择分为两个部分，一个是子集搜索，一个是子集评价。子集搜索有前向搜索，后向搜索，双向搜索，但是都是贪心的。子集评价是通过计算属性的信息增益。即使用该特征后，降低了训练样本的不确定性。信息增益越大表明...

如何做一名合格的面试官

追梦赤子心

07-20

5194

面试最主要的？？？？是判断力，即指：主观地收集、整理、加工客观意识能力 面试官需要具备专业素质：感受能力、心理能力、情绪能力、认知能力、发展意愿、岗位分析、量化评估、测评工具、学习能力、管理经验心理测试的冰山模型，就是说在面试过程了解到候选人内在的东西只是很少一部分，这就要考验面试官的能力咯。检测执行力（倾听和成果向导要求）：1 仔细聆听关注细节，注意时间和任务 2 了解工作要求和标...

面试官再问你 HashMap 底层原理，就把这篇文章甩给他看

m0_55849656的博客

06-16

164

面试官再问你 HashMap 底层原理，就把这篇文章甩给他看

软件测试面试项目问答怎么回答才能让面试官认可？

m0_60054525的博客

02-26

1119

Bug的话不一定哦，关键还得看开发，哈哈，开发的版本质量好的话，BUG就会少些，整个版本比较好的情况下大概也就二十来个BUG，当然如果遇到开发是个新手，那么找到60-70个也是很常见的，比如之前的那个金融项目，足足发现了72个BUG，这样的情况下追踪BUG的工作量都比较的大，如果是版本选代的话，那么基本就不会出现多少BUG了。3）重新选择下拉框，输入信息全部清空，原因，修改类型，重新刷新界面，输入数据，并没有保存缓存里面，导致一刷新，原来信息没有，解决，开发选择不同借款类型，不再进行刷新。

软件测试面试一直挂，面试官总是说逻辑思维混乱，怎么办？

dsfsksnbkjnbsfv的博客

08-28

380

逻辑思维混乱是因为你根本没高工面试官问的问题，答非所问。或者就是你没有一个很清晰的回答思路。下面我就列举一些面试可能会问到的问题以及一些回答思路。1、你对于我们公司了解多少?回答提示：在去公司面试前上网查一下该公司主营业务。如回答：贵公司有意改变策略，加强与国外大厂的OEM合作，自有品牌的部分则透过海外经销商。2、你最擅长的技术方向是什么?回答提示：说和你要应聘的职位相关的课程，表现一下自己的热诚没有什么坏处。3、你能为我们公司带来什么呢?...

如何在面试中介绍自己的项目，才能让软件测试面试官无可挑剔，

分享测试知识

02-21

1541

特征选择(Feature Selection)

aaron的专栏

10-28

4722

交叉验证直接介绍k折叠交叉验证(k-fold cross validation)： 1 1. 特征选择 1.1 相关系数先考虑对连续的输出y进行预测，皮尔森相关性系数为： 2 Cov代表协方差，var代表方差，R(i)的估计定义为： 3 相关性系数描述了xi与y之间的相关性，如果R(i)等于1或者-1，则xi与y线性相关。所以，我们可以用4作为特征排列的一

几种常用的特征选择方法

开开_王子的博客

08-21

626

http://www.voidcn.com/article/p-euemlmcd-ys.htmlscikit-learn中提供的几个例子： http://scikit-learn.org/stable/modules/feature_selection.html#univariate-feature-selection

特征选择的几种常见方法

JingYi的专栏

09-17

1万+

最近参加秋招笔试，发现关于特征选择的题目出现了不少，于是打算网上查查资料总结一下，发现下面两篇文章写得很好，两篇一起看，通俗易懂。 特征选择 特征选择常用算法综述...

如何进行特征选择

datoutong_的博客

12-15

2万+

如何进行特征选择 原文地址：http://blog.csdn.net/u010670689/article/details/73196546 特征选择对于数据科学家、机器学习从业者来说非常重要。好的特征选择能够提升模型的性能，更能帮助我们理解数据的特点、底层结构，这对进一步改善模型、算法都有着重要作用。当数据预处理完成后，我们需要选择有意义的特征输入机器学习的算法和模型进行训练

特征选择/筛选方法总结

jliang3的博客

03-30

8万+

作者：jliang https://blog.csdn.net/jliang3 1.特征选择介绍 1）特征分类相关特征：对于学习任务（例如分类问题）有帮助，可以提升学习算法的效果；无关特征：对于我们的算法没有任何帮助，不会给算法的效果带来任何提升；冗余特征：不会对我们的算法带来新的信息，或者这种特征的信息可以由其他的特征推断出； 2）特征选择的目的对于一个特定的学习算法...

特征选择（Feature Selection）

hren_ron的博客

07-04

8万+

主要内容：为什么要进行特征选择？什么是特征选择？怎么进行特征选择 特征选择：在现实生活中，一个对象往往具有很多属性（以下称为特征），这些特征大致可以被分成三种主要的类型：相关特征：对于学习任务（例如分类问题）有帮助，可以提升学习算法的效果；无关特征：对于我们的算法没有任何帮助，不会给算法的效果带来任何提升；冗余特征：不会对我们的算法带来新的信息，或者这种特征的信...

机器学习：特征选择（feature selection）