ML&DL-总结性文章
Zero-One-0101
小菜鸟一枚,正在成长中!
展开
-
常见8种机器学习算法总结
简介机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域等等,要想找到一个合适算法真的不容易,所以在实际应用中,我们一般都是采用启发式学习方式来实验。通常最开始我们都会选择大家普遍认同的算法,诸如SVM,GBDT,Adaboost,现在深度学习很火热,神经网络也是一个不错的选择。假如你在乎精度(accuracy)的话,最好的方法就...转载 2019-03-18 11:46:12 · 420 阅读 · 0 评论 -
机器学习问题总结(02)
文章目录1.stacking模型以及做模型融合的知识1.1 从提交结果中融合1.2 stacking1.3 blending2. 怎样去优化SVM算法模型的?2.1 SMO优化算法2.2 libsvm 和 Liblinear3.现有底层是tensorflow的keras框架,如果现在有一个tensorflow训练好的模型,keras怎么读取?3.1 tf模型的保存与导入模型保存:导入预训练好的模型...原创 2019-04-12 09:26:24 · 482 阅读 · 0 评论 -
机器学习问题总结(03)
文章目录1.struct和class区别,你更倾向用哪个2.kNN,朴素贝叶斯,SVM的优缺点,各种算法优缺点2.1 KNN算法2.2 朴素贝叶斯2.3SVM算法2.4 ANN算法2.5 DT算法3. 10亿个整数,1G内存,O(n)算法,统计只出现一次的数。4、海量数据排序4.1 数据库排序4.2 分段排序4.3 **bit位操作 **5、项目中的数据是否会归一化处理,哪个机器学习算法不需要归一...原创 2019-04-12 09:27:49 · 528 阅读 · 0 评论 -
机器学习问题总结(04)
文章目录1、MLP的BP过程2、maxpool层BP怎么做的2.1 **mean pooling**2.2 max pooling3、opencv遍历像素的方式,讲两种?4、传统图像处理有了解过吗,比如去噪 特征提取5、问在linux下写过代码吗? 问用了什么软件工具6、LDA(狄利克雷分布)7、PR曲线、ROC曲线7.1、查准率、查全率、F17.2、ROC和AUC7.3、偏差和方差8、特征工程8...原创 2019-04-12 09:28:42 · 756 阅读 · 0 评论 -
机器学习公式推导
文章目录线性回归逻辑回归线性判别分析PCAk-means决策树svm随机深林GBDTxgboost强化学习MapReduce线性回归逻辑回归对于分类问题:输出0/1,超过[0,1]没有意义,使用sigmoid函数**代价函数:**使用L2平方差,由于模型函数变了,会导致J()变成非凸函数,有可能出现很多局部最小值,梯度下降很难收敛到全局最小值线性判别分析LDA思想:将高维样本投影到...原创 2019-04-05 10:17:15 · 343 阅读 · 0 评论 -
特征工程总结
目录1 特征工程是什么?2 数据预处理 2.1 无量纲化 2.1.1 标准化 2.1.2 区间缩放法 2.1.3 标准化与归一化的区别 2.2 对定量特征二值化 2.3 对定性特征哑编码 2.4 缺失值计算 2.5 数据变换3 特征选择 3.1 Filter 3.1.1 方差选择法 3.1.2 相关系数法 3.1.3 卡...转载 2019-04-09 18:19:59 · 347 阅读 · 0 评论 -
机器学习问题总结(05)
文章目录1. Hadoop、Spark1.1 hadoop1.2 spark1.3 MapReduce1.3.1 概念1.3.1 MapReduce执行流程**MapReduce编程主要组件**2、机器学习场景3、推荐系统(预测电影等级)4、CTR(点击通过率 -> 广告)5、SVM5.1 svm的原理5.2 SVM的核技巧6、K-means6.1 K-means算法6.2、如何用 hado...原创 2019-04-12 09:29:50 · 465 阅读 · 0 评论 -
面试题汇总---深度学习(图像识别,NLP内容)
文章目录1.基本概念1.1 为什么神经网络中深度网络的表现比广度网络表现好?2.卷积神经网络2.1 1*1卷积核的左右有哪些?3.循环神经网络3.1 画出RNN,LSTM,GRU的神经单元示意图?4.其他4.1 简述一下GAN网络的原理?1.基本概念1.1 为什么神经网络中深度网络的表现比广度网络表现好?2.卷积神经网络2.1 1*1卷积核的左右有哪些?3.循环神经网络3.1 画出RN...原创 2019-07-15 19:44:30 · 2276 阅读 · 0 评论 -
机器学习问题总结(01)
文章目录2019.04.011.请描述推荐系统中协同过滤算法CF的原理2.请描述决策树的原理、过程、终止条件,以及如何防止过拟合2.1决策树生成算法2.2 剪枝处理(防止过拟合)2.3 停止条件2.4 棵决策树的生成过程2.5 决策树的损失函数3.请描述K-means的原理,说明选择聚类中心的方法3.1 算法流程图3.2 聚类中心初始化问题4.请列举分类模型和回归模型的区别5.请列举生成模型与判别...原创 2019-04-12 09:24:59 · 630 阅读 · 0 评论 -
机器学习算法分类总结
机器学习方法分类总结这篇文章只是一个类似于知识概括的文章,主要作用是帮忙梳理:1) 分类贝叶斯模型(Bayesian Mode)- 朴素贝叶斯算法(Naive Bayesian Mode)- 平均单依赖估计(AveragedOne-Dependence Estimators, AODE)- Bayesian Belief Network(BBN)K-邻近 (k-Nearest Ne...转载 2019-04-08 16:03:33 · 461 阅读 · 0 评论 -
机器学习知识总结系列- 知识图谱(0-0)
文章目录目录机器学习知识图谱目录本系列的文章只是根据个人的习惯进行总结,可能结构与一些书籍上不太一样,开始的内容比较简单,会随着后续的深入,不断丰富和更新图谱,同时也期待有相同兴趣的朋友一起给我留言一起丰富!也非常欢迎各位能够指出错误!机器学习知识图谱...原创 2019-03-19 10:18:41 · 514 阅读 · 0 评论 -
机器学习知识总结系列- 基本概念(1-0)
文章目录目录1. 机器学习的定义2. 机器学习的分类2.1根据是否在人类监督下进行训练监督学习非监督学习半监督学习强化学习2.2根据是否可以动态渐进的学习在线学习批量学习2.3根据是否在训练数据过程中进行模式识别实例学习基于模型的学习3. 机器学习中的一些常见名词4. 机器学习的挑战4.1 训练的数据量不足4.2 没有代表性的数据4.3 低质量的数据4.4 不相关的特征4.5 过拟合和欠拟合5. ...原创 2019-03-19 13:05:01 · 300 阅读 · 0 评论 -
机器学习知识总结系列- 特征工程(1-1)
文章目录目录目录原创 2019-03-26 21:07:08 · 188 阅读 · 0 评论 -
机器学习中的距离和损失函数
文章目录13.1 距离度量13.2 损失函数13.1 距离度量距离函数种类:欧式距离、曼哈顿距离、明式距离(闵可夫斯基距离)、马氏距离、切比雪夫距离、标准化欧式距离、汉明距离、夹角余弦等常用距离函数:欧式距离、马氏距离、曼哈顿距离、明式距离1.欧式距离欧式距离是最容易直观理解的距离度量方法,我们小学,中学,高中所接触的两个空间中的距离一般都是指的是欧式距离。2.曼哈顿距离(Manh...原创 2019-04-05 10:17:00 · 5137 阅读 · 0 评论 -
机器学习知识总结系列- 模型评估(1-2)
原创 2019-03-27 13:21:01 · 170 阅读 · 0 评论 -
机器学习知识总结系列-机器学习中的数学-矩阵(1-3-2)
矩阵 SVD 矩阵的乘法状态转移矩阵状态转移矩阵特征值和特征向量 对称阵 正交阵 正定阵数据白化矩阵求导 向量对向量求导 标量对向量求导 标量对矩阵求导一.矩阵1.1 SVD奇异值分解(Singular Value Decomposition),假设A是一个m×n阶矩阵,则存在一个分解使得&...原创 2019-04-05 16:50:48 · 1253 阅读 · 0 评论 -
机器学习知识总结系列-机器学习中的优化算法总结(1-4)
文章目录梯度下降批量梯度下降随机梯度下降Mini-batch gradient descent比较:Mini-batch gradient descent的缺点momentumAdagradRMSpropAdam总结梯度下降批量梯度下降每进行1次参数更新,需要计算整个数据样本集:θ=θ−η∇θJ(θ)随机梯度下降Mini-batch gradient descent比较:Mi...原创 2019-04-05 10:16:42 · 345 阅读 · 0 评论 -
机器学习知识总结系列-机器学习中的数学-概率与数理统计(1-3-1)
文章目录目录1.概率与统计1.1 机器学习与概率统计之间的关系1.2 重要的统计量1.2.1 期望1.2.2 方差1.2.3 协方差,相关系数协方差相关系数1.2.4 矩1.3 重要的定理与不等式1.4 用样本估计参数目录1.概率与统计1.1 机器学习与概率统计之间的关系1.什么是概率问题和统计问题概率问题:已知数据的整体分布,然后求取抽样数据的概率。统计问题:是概率问题的逆过程,即...原创 2019-03-28 10:55:43 · 1123 阅读 · 0 评论 -
机器学习中的聚类方法总结
聚类定义定义聚类就是对大量未知标注 的数据集,按数据 的内在相似性将数据集划分为多个类别,使 类别内的数据相似度较大而类别间的数据相 似度较小。是无监督的分类方式。聚类思想给定一个有N个对象的数据集,构造数据的k 个簇,k≤n。满足下列条件: 每一个簇至少包含一个对象 每一个对象属于且仅属于一个簇 将满足上述条件的k个簇称作一个合理划分基本思想:对于给定的类别数目k,首先给出初...转载 2019-04-11 17:18:42 · 2220 阅读 · 0 评论 -
神经网络中的优化算法总结
在调整模型更新权重和偏差参数的方式时,你是否考虑过哪种优化算法能使模型产生更好且更快的效果?应该用梯度下降,随机梯度下降,还是Adam方法?这篇文章介绍了不同优化算法之间的主要区别,以及如何选择最佳的优化方法。什么是优化算法?优化算法的功能,是通过改善训练方式,来最小化(或最大化)损失...转载 2019-04-23 19:13:07 · 3437 阅读 · 0 评论