分类问题
草莓甜Swag
这个作者很懒,什么都没留下…
展开
-
吴恩达机器学习笔记——机器学习系统设计
对应吴恩达机器学习网易云课程第12章的内容。 误差分析 当我们研究一个机器学习问题时,我们可以先建立一个简单模型,然后画出学习曲线得到优化方案,或者可以采用人工的误差分析,查看被误判的对象,总结出新的特征,制定出新的方案。 同时,我们可以在验证集上量化错误率,取舍优化方案。 以垃圾邮件的识别为例,我们可以选出垃圾邮件或非垃圾邮件出现频率最高的一些词,然后构建对应的向量,用0/1代表是...原创 2019-02-14 18:01:06 · 186 阅读 · 0 评论 -
吴恩达机器学习笔记——无监督学习与K-means
K-meas 算法概述 随机生成K个点,称为聚类中心。K-means算法实际上是一个迭代算法,他有两步动作。在算法的最开始,随机初始化K个聚类中心,坐标位置分别为。第一步是簇分配,第二步是移动聚类中心。遍历图中的每一个点,判断点跟哪个聚类中心的距离更近,进而划分到这个聚类中心名下,并将聚类中心的下标赋给对应样本点的,这个步骤其实也是代价函数的最小化过程。然后对所有的样本点向量求平均值(忽...原创 2019-02-15 22:16:17 · 353 阅读 · 0 评论 -
吴恩达机器学习笔记——分类问题
是对应网易云课程吴恩达机器学习第七章的笔记。 分类问题的引入 待预测目标为离散,可以是二分类、多分类问题。如,其中0表示没有命中目标(负类),1表示命中目标(正类)。(非严格要求) 可以使用: 线性回归拟合:设置分类器输出的阀值,如,横坐标对应的纵坐标高于0.5输出1,否则输出0。适用于正负样本在横轴上集中为两组的情况。算法的输出值可能远大于1或远小于0,具有数据集相关的偶然性,不是一个好的...原创 2019-02-10 13:19:24 · 320 阅读 · 0 评论 -
吴恩达机器学习——异常检测
异常检测算法 算法就是通过已有数据集根据所有的特征建立一个概率模型,用于新样本的预测,当新样本的概率小到一定程度时则认为出现异常。 算法步骤: 选择有用的特征集。 对每一个特征结合高斯算法公式得到均值和方差。 概率是各个特征概率的乘积。 对一个新样本的各个分量值代入对应的概率公式得到值,于预设的阈值作比较得到结果。当小于阈值时则认为出现异常。 算法图像: 以有两个特征为例,立体图像越高...原创 2019-02-17 23:09:43 · 261 阅读 · 0 评论