机器学习
文章平均质量分 92
海上机械师
同济大学计算机系在读博士研究生,研究兴趣是说话人识别及其相关应用。
博客主要涉及机器学习与深度学习方面的算法介绍,Python、Java 与 Matlab 的编程实现。
展开
-
异常检测与推荐系统 机器学习基础(8)
异常检测 异常检测被广泛应用于欺诈检测(例如信用卡被偷事件)。给定大量数据,指出与均值有巨大差异的点。例如,在制造业中检测缺陷与异常。高斯分布对数据建模往往会很有用。 本模块涉及“推荐系统”(Amazon, Netflix, Apple 等公司用它来向用户推荐产品)。推荐系统(Recommender systems)寻找用户与产品间的交互模式从而生成推荐建议。该课程介绍了推荐算法,例如原创 2016-03-01 14:51:35 · 2256 阅读 · 0 评论 -
Foundations : Machine Learning Specialization of University of Washington
Congratulation for completing my course, Machine Learning Specialization of University of Washington.原创 2016-05-21 22:30:15 · 1078 阅读 · 0 评论 -
无监督学习与维度约减 机器学习基础(7)
这里介绍了无监督学习与纬度约减的基础知识。无监督学习部分:1 数据类型:无标签2 K-means 以及代价函数与算法3 K-means 中参数 K 的选择维度约减(降维)部分:1 主成分分析的概念、数学表达与求解方法2 SVD 的降维应用原创 2016-02-28 11:51:37 · 1699 阅读 · 0 评论 -
支持向量机 SVM 机器学习基础(6)
支持向量机 Support vector machines SVM介绍了支持向量机的代价函数、核函数与求解算法。同时,不同的监督学习算法的使用场合,也做了初步的介绍。同时着重介绍了高斯核函数的计算方法。在本文,我提供了 SVM 导论的下载链接与 svm 软件包的下载链接。希望大家的一起交流,一起成长。原创 2016-02-27 20:47:09 · 1382 阅读 · 0 评论 -
Digit Recognizer Kaggle 竞赛系列
手写数字识别1. KNN 准确率 0.83886,KNN 算法预测花费时间很长2. IPCA + KNN 准确率 0.84614,IPCA 降维可能会超内存3. IPCA + RandomForest 准确率 0.84614,RandomForest 随机森林的效率比 KNN 高4. RandomForest,准确率 0.96443,深度学习中的卷积神经网络能达到 0.99+ 准确率的效果原创 2016-03-05 11:02:08 · 1365 阅读 · 0 评论 -
Titanic Kaggle 竞赛系列
Titanic: Machine Learning from DisasterKaggle 竞赛中的练习题Accuracy: 0.779900-1 分类:根据乘客类型,姓名,性别,年龄,兄弟个数,父子个数,船票,票价,船舱,港口判定乘客是船难中存活下来。数据处理可采用 pandas 工具包,分类器可采用 scikit-learn 工具包。原创 2016-03-09 17:23:28 · 1576 阅读 · 1 评论 -
机器学习系统设计与应用机器学习的建议 机器学习基础(5)
关于应用机器学习的建议与设计机器学习系统。提高机器学习系统的性能,学习评估方法是一种有效的解决方案,其中包含统计、分析错误分类数据,学习曲线讨论偏差与方差,讨论正则化参数和偏差与方差的关系等。构建一个优秀的机器学习系统,必须能够处理有偏斜的数据,以增加系统的有效性与鲁棒性,而数值评估的误差分析,查准率与召回率的评估是有效的办法。大数据是目前热议的话题,的确大数据在某些机器学习系统中有显著的作用。原创 2016-02-23 20:38:49 · 1294 阅读 · 0 评论 -
神经网络的学习 机器学习基础(4)
神经网络包含前向传播与反向传播。1. 神经网络的代价函数2. 神经网络的反向传播表达与算法3. 神经网络的应用原创 2016-02-19 20:38:45 · 1347 阅读 · 0 评论 -
神经网络的表达式 机器学习基础(3)
神经网络可应对复杂的非线性分类。非线性假设当特征量多大时,特征的非线性组合方法种类的数量会非常庞大,可能对造成过拟合与极大的计算复杂度的问题。原创 2016-02-19 19:45:08 · 3395 阅读 · 0 评论 -
机器学习之初生牛犊
多元线性回归 + 逻辑回归 + 神经网络的表达式 + 神经网络的学习 + 机器学习系统设计与应用机器学习的建议 + 支持向量机 SVM + 无监督学习与维度约减 + 异常检测与推荐系统 + 大规模机器学习 + 应用实例:照片识别原创 2016-03-04 22:04:50 · 830 阅读 · 0 评论 -
应用实例:照片识别 机器学习基础(10)
应用实例本文主要讲了有关图像识别项目相关的介绍,仅仅设计简单的机器学习系统设计,包含系统流水线、上限分析、人工数据合成。当然,文字识别与人脸识别的简单系统由详细的介绍,可以用以初步的了解。Python, Java, MATLAB 都有机器学习的工具箱。原创 2016-03-04 21:42:49 · 1952 阅读 · 0 评论 -
大规模机器学习 机器学习基础(9)
大规模机器学习大规模机器学习面上海量数据的要求,其方法是类似映射化简(SOM)的思路。目前已有的平台有 Hodoop。本文介绍了一些大规模机器学习中会遇到的随机梯度下降法、映射化简的概念,同时在线学习也是一种在海量数据中应运而生的学习模式。原创 2016-03-04 20:41:37 · 730 阅读 · 0 评论 -
逻辑回归 机器学习基础(2)
主要任务:逻辑回归(logistic regression)分类正则化(regularization),避免过拟合(over fitting)1. 逻辑回归的表达式与求解方法2. 应用逻辑回归到多类分类上3. 应用正则化的方法避免过拟合原创 2016-01-29 17:35:55 · 930 阅读 · 0 评论 -
多元线性回归 机器学习基础(1)
机器学习基础之多元线性回归描述了假设函数、求解方法(梯度法和正规方程)、基于Octave/MATLAB的向量化表达方法。原创 2016-01-25 15:23:16 · 1382 阅读 · 0 评论 -
Facial keypoints detection Kaggle 竞赛系列
Facial keypoints detection该题主要任务是检测面部关键点位置, Detect the location of keypoints on face images问题表述在本问题中,要求计算面部关键点的位置,即关键点在图片中的百分比坐标。 因此该问题的机理就是 [0, 1] 范围内的数值拟合,当然了,这也是一个多输出的拟合和你问题。原创 2016-04-03 20:38:55 · 4229 阅读 · 11 评论