机器学习
Vico_Men
这个作者很懒,什么都没留下…
展开
-
(机器学习算法常用指标)准确率,召回率,F1 值、ROC,AUC、mse、mape评价指标
机器学习算法常用指标文章汇总(持续更新):1、雪伦csdn:准确率,召回率,F1 值、ROC,AUC、mse,mape评价指标http://blog.csdn.net/a819825294/article/details/516992112、Poll的笔记:机器学习算法常用指标http://www.cnblogs.com/maybe2030/p/5375175.html...转载 2017-04-19 14:38:13 · 4197 阅读 · 0 评论 -
线性回归的欠拟合、过拟合问题总结
针对最近在《机器学习实战》的线性回归中遇到的问题,做一个学习小结。一、欠拟合局部加权线性回归(LWLR):1、在线性回归发生欠拟合的时候,在估计中引入一些偏差,降低预测的均方误差。2、我们给待预测的点附近的点一定的权重,而使得远离它的点权重较低3、非参数学习方法:(1)有参数学习方法是啥?eg:LR。在训练完所有数据之后得到一系列训练参数,然后根据训练参数来预测样本的值这时原创 2017-03-09 19:46:27 · 16629 阅读 · 0 评论 -
RF、GBDT、XGBoost面试级整理
由于本文是基于面试整理,因此不会过多的关注公式和推导,如果希望详细了解算法内容,敬请期待后文。 RF、GBDT和XGBoost都属于集成学习(Ensemble Learning),集成学习的目的是通过结合多个基学习器的预测结果来改善单个学习器的泛化能力和鲁棒性。 根据个体学习器的生成方式,目前的集成学习方法大致分为两大类:即个体学习器之间存在强依赖关系、必须串行生成的序列化方法原创 2017-04-17 10:01:40 · 62236 阅读 · 4 评论 -
PCA原理分析
无监督学习:数据没有附带任何标签,也即无监督学习的目标是找到数据的某种内在结构。 降维:将数据从高维空间降低到低维,降维可见的优势包括:1、使得数据更容易使用;2、降低很多算法的计算开销;3、去除噪声(下面结合PCA再解释);4、使得结果易懂。 常见的降维方法包括但不限于: 1. PCA(Principal Compotent Analysis),主成分分析;2. 因子分析;3. 独立成分分析原创 2017-03-19 11:01:36 · 823 阅读 · 0 评论 -
决策树算法汇总
针对最近学习的决策树模型的CART算法,做一个学习总结。1、CART、ID3和C4.5a) 以上三者都属于决策树模型 决策树:一种基本的分类和回归的算法,以树形结构基于特征对实例进行分类的过程。 决策树优点:1、决策树模型可读性好,有助于人工分析;2、效率高,只需一次构建就能反复使用。 比较:决策树与朴素贝叶斯(NBC)是最为广泛使用的两种分类模型,朴素贝叶斯算法的基原创 2017-03-15 11:25:57 · 1127 阅读 · 0 评论 -
机器学习-分类和逻辑回归
这里用到的数据是Andrew老师在coursera授课时作业中的数据,由于上传过程中公式格式有点乱,因此省掉了原理部分,具体的可以看Andrew老师的授课视频和讲义。两分类问题,特征值为学生的两门课考试成绩,y值0、1决定学生是否被学校录取。这里包含两端程序,都能实现功能。其中程序一没有采用matlab内建的fminunc函数,需要自己设定学习速率;程序二程序采用matlab内建的原创 2016-12-13 21:52:35 · 1885 阅读 · 3 评论 -
NLP底层技术之句法分析
句法分析是自然语言处理(natural language processing, NLP)中的关键底层技术之一,其基本任务是确定句子的句法结构或者句子中词汇之间的依存关系。 句法分析分为句法结构分析(syntactic structure parsing)和依存关系分析(dependency parsing)。以获取整个句子的句法结构或者完全短语结构为目的的句法分析,被称为成分结构分析(co原创 2018-01-28 16:54:18 · 38949 阅读 · 3 评论 -
深度学习相关总结
博客来源于本人在深度学习中的知识点总结,基于本人学习进度不定期更新。1、为什么相比于RNN,LSTM在梯度消失上表现更好?Reference: 1. http://blog.csdn.net/a635661820/article/details/45390671 2. http://blog.csdn.net/dark_scope/article/details/4705636原创 2018-01-14 12:17:12 · 1685 阅读 · 0 评论 -
基于Keras的LSTM多变量时间序列预测
本文翻译自Jason Brownlee的博客Multivariate Time Series Forecasting with LSTMs in Keras 传统的线性模型难以解决多变量或多输入问题,而神经网络如LSTM则擅长于处理多个变量的问题,该特性使其有助于解决时间序列预测问题。 在接下来的这篇博客中,你将学会如何利用深度学习库Keras搭建LSTM模型来处理多个变量的时...翻译 2018-01-12 17:48:51 · 108095 阅读 · 117 评论