机器学习笔记
文章平均质量分 83
心潇瑶
这个作者很懒,什么都没留下…
展开
-
推荐系统与应用
七月在线4月机器学习算法班课程笔记——No.9前言 推荐系统——我早就很感兴趣的一个方向,可以说是机器学习在各个公司广泛应用的一个内容,从求职招聘就可以感觉到。另外,我们也经常在使用推荐系统,比如以推荐为特色的今日头条(你关心的,才是头条),还有淘宝的商品推荐等。曾经试图在网络上了解推荐系统,但都是零散的内容,不是太系统。这次算是有条理的学习了,get到了之前好奇的问题,自然要好好整理。原创 2016-06-20 16:42:47 · 10370 阅读 · 0 评论 -
数理统计与参数估计
系统的学习概率论与数理统计是在大学二年级,当时还没有接触计算机应用的内容,仅把概率论作为一门纯数学课来学习,我们的老师当然也是数学系的。慢慢地发现概率论与数理统计是好多学科研究的基础,包括经济学、人工智能等等。鉴于它的重要性,有必要结合应用场景重新加深对概率论知识的理解。原创 2016-05-30 18:59:02 · 4020 阅读 · 0 评论 -
矩阵分析与应用
第三讲依然是数学,因为数学是解决一切问题的基础。一个问深入到最后都是数理知识的支撑。所谓基础决定上层建筑,比如参加ACM比赛,高手之间的比赛已经不是编程技巧了,更多的是数学知识的比拼。若想走得远,数学基础一定要打好。嗯,好遗憾之前学数学多是为了考试,学完就忘,现在要好好再复习一下。程博士用两个小时概讲了《线性代数》《矩阵论》两本书的内容,结合其他的相关资料,总结一下。原创 2016-05-31 17:34:02 · 13008 阅读 · 0 评论 -
凸优化初步
前言 这节课主要介绍凸优化的入门知识,程博士推荐阅读Boyd的《凸优化》,最经典的凸优化的书,这本书有600多页,细致讲解了凸优化相关的理论知识,可以作为一门学科来学习。因为硕士阶段学过《工程优化》,在这次学习过程中能容易的get到思想。 一般的优化问题包括 有约束和无约束两种,在这里我们将要弄清楚两件事情:为什么要优化?为什么要凸优化?原创 2016-06-03 17:59:52 · 6752 阅读 · 0 评论 -
线性回归与逻辑回归
回归算法是一种通过最小化预测值与实际结果值之间的差距,而得到输入特征之间的最佳组合方式的一类算法。对于连续值预测有线性回归等,而对于离散值/类别预测,我们也可以把逻辑回归等也视作回归算法的一种。 线性回归与逻辑回归是机器学习中比较基础又很常用的内容。线性回归主要用来解决连续值预测的问题,逻辑回归用来解决分类的问题。原创 2016-06-06 17:04:28 · 21936 阅读 · 1 评论 -
特征工程
七月在线4月机器学习算法班课程笔记——No.6 前言 机器学习领域的大神Andrew Ng(吴恩达)老师曾说“Coming up with features is difficult, time-consuming, requires expert knowledge. “Applied machine learning” is basically feature engineering. ”表原创 2016-06-12 16:16:23 · 21902 阅读 · 3 评论 -
工作流程与模型调优
七月在线4月机器学习算法班课程笔记——No.7前言 我们知道,机器学习的过程是非常繁琐的。上一篇介绍了机器学习中特征处理重要而耗时,然而特征处理仅属于机器学习前序的工作内容。特征工程之后,需要选择机器学习模型、交叉验证、寻找最佳超参数等建模步骤。搭建模型之后呢,还需要进行模型的优化,模型调优是实际生产中一个必要的环节,也是不断去改进的一个事情。 这一篇会以小的数据集为例,讲一下机器学习在实原创 2016-06-15 14:47:19 · 2851 阅读 · 1 评论 -
信息论、最大熵模型
七月在线4月机器学习算法班课程笔记——No.81. 统计学习基础回顾1.1 先验概率与后验概率 先验概率:根据以往经验和分析得到的概率,如全概率公式,它往往作为”由因求果”问题中的”因”出现。 后验概率:依据得到”结果”信息所计算出的最有可能是那种事件发生,如贝叶斯公式中的,是”执果寻因”问题中的”因”。后验概率可以根据通过贝叶斯公式,用先验概率和似然函数计算出来。 贝叶斯定理:假设原创 2016-06-16 15:03:42 · 4768 阅读 · 2 评论 -
聚类算法与应用
七月算法4月机器学习算法班课程笔记——No.10前言 与回归与分类不同,聚类是无监督学习算法,无监督指的是只需要数据,不需要标记结果,试图探索和发现一些模式。比如对用户购买模式的分析、图像颜色分割等。聚类算法的提出比较早,是数据挖掘的一个重要模块,可以对大量数据分类并概括出每一类的特点。目前也有很多种聚类算法,包括划分法、层次法、基于密度的方法、基于网格的方法等。实际生产中,很少有只用聚类算法的原创 2016-06-23 19:37:24 · 19095 阅读 · 3 评论 -
机器学习与微积分
机器学习是一门多领域交叉学科,包括概率论、统计学、凸分析、特征工程等等。最近跟着七月算法学习了机器学习的知识,干货不少,比看书理解的快一些,分别总结一下。原创 2016-05-25 17:33:18 · 6229 阅读 · 0 评论