机器学习
文章平均质量分 50
Ding_xiaofei
程序员
展开
-
机器学习中的熵
开篇熵这个词在机器学习中出镜率颇高,机器学习中使用的熵基本是信息熵相关的一些熵,这边博客我会聊到决策树和逻辑回归,至于最大熵,后期我会在这篇博客上补上,当然,我复习到其他机器学习算法用到熵的概念的话,我也会在这篇博客上续上。熵的定义什么是熵呢,它为什么又要那么定义呢?熵,就感性的理解来说,它是描述混乱程度的量。什么叫混乱程度呢,我们可以联系到概率上,如果一件事件各个可能性都有,那么...原创 2018-04-26 14:00:56 · 1406 阅读 · 0 评论 -
机器学习中的损失函数
开篇很多时候,机器学习的算法是可以按照损失函数来划分的,像我以前博客中提到的LR和SVM的区别,首先它们的损失函数就是不一样的。这边我还是先整理一部分损失函数,近期会逐步的完善。交叉熵损失函数交叉熵就是用来判定实际的输出与期望的输出的接近程度关于熵的一些概念,这边不多加赘述,大家可以参考我的博客这边的话,其实最开始的主要目的就是衡量两个概率分布的距离,如何是衡量两个分布的距离呢,这里需要...原创 2018-09-18 13:16:24 · 2958 阅读 · 0 评论 -
机器学习面试题解(1-5)
1、L1正则和L2正则的区别先放上一个参考博客https://blog.csdn.net/jinping_shi/article/details/52433975原创 2018-09-17 23:52:04 · 366 阅读 · 0 评论 -
各大互联网公司面经集锦(附解答)
数据库数据库多表查询 MYSQL常用引擎及其区别(innoDB、MyISAM、MEMORY区别) B树、B+树数据结构、区别 select、epoll,以及边缘触发、水平触发 数据库的索引介绍一下 MySQL用的挺多,问你一下,innodb的b+树索引,主键索引,聚簇索引有什么区别。 MySQL里有哪些锁,行锁表锁,乐观锁呢,我说了版本号和MVVC,开始问我MVVC。 事务...原创 2018-09-17 15:45:19 · 1081 阅读 · 0 评论 -
支持向量机(SVM)和逻辑回归(LR)
开篇为什么把这两个机器模型放在一起呢,主要是因为它们经常会在面试中同时出现,这边把它们放在一起,解析一下它们之间的联系和区别。我们先看一下问题经典算法问题 LR 与 SVM 的相同和不同? 讲一下其中的LR、SVM,以及区别和联系(2018京东算法)解析 相同点: 1、首先两个都是常用的分类算法,这边要注意的是,不要看LR带了回归二字就以为它是回归模型,其实不是,它是分类模型。...原创 2018-09-12 16:01:07 · 1270 阅读 · 0 评论 -
机器学习中的一些评价指标
开篇整理一些机器学习中的评价指标精确率和召回率关于定义我不多加赘述,大家可以自己搜一搜,或者说看一下我下面的参考博客。 参考博客为了帮助大家理解什么是精确率和召回率,我举下面几个例子:首先是地震预测,我有一个预测模型我的模型预测了100次地震,其中90次真的发生了地震,还有10次没有发生地震,那么它的精确度就是90% 可以和上面没有任何联系 事实上发生了100次地震,...原创 2018-09-05 20:48:43 · 227 阅读 · 0 评论 -
机器学习笔记
开篇拖了很久,才开始复习一些机器学习模型,这边依旧是一个检索目录,本目录下面的博客可能不会太过精美,甚至很多公式可能就是手写的,但是希望能够浅显的帮助大家复习和学习机器学习的一些知识,当然有代码的还是会奉上一些代码索引机器学习中的隐变量和隐变量模型概率图模型隐马尔可夫模型...原创 2018-08-30 14:58:19 · 368 阅读 · 0 评论 -
概率无向图模型:条件随机场
开篇先来一篇博文感性认识一下什么是条件随机场 参考博客 里面的一些公式还是解释的不够清楚,所以我会结合李航老师和宏毅老师的一些内容来完善整个条件随机场的东西,希望能够帮助到大家。...原创 2018-09-01 17:04:15 · 585 阅读 · 0 评论 -
机器学习策略
评价指标查准率(precision)和查全率(recall)翻译很贴近它要表达的意思 恩达举的例子 查准率的定义是在你的分类器标记为猫的例子中,有多少真的是猫。所以如果分类器A有95%的查准率,这意味着你的分类器说这图有猫的时候,有95%的机会真的是猫。查全率就是,对于所有真猫的图片,你的分类器正确识别出了多少百分比。实际为猫的图片中,有多少被系统识别出来?如果分类器A查全率是...原创 2018-08-08 20:33:10 · 405 阅读 · 0 评论 -
概率图模型(HMM)
开篇拖了很久,现在补上概率图的几个模型,陆续补上这部分的内容。概率算是机器学习里面比较抽象和难以理解的模型,它很多时候被应用在自然语言上的一些基本,想是词性标注,命名实体。...原创 2018-08-13 14:32:39 · 2663 阅读 · 0 评论 -
机器学习笔记(三):一个完整的机器学习项目
开篇波折了一个多月,顺利在华为实习,在晚上加班的空余时间继续刷我的机器学习笔记。查找关联前面我们通过画图分析了一些数据的相关属性。因为数据集并不是非常大,我们可以很容易地使用corr()方法计算出每对属性间的标准相关系数(standard correlation coefficient,也称作皮尔逊相关系数):corr_matrix = housing.corr()现在...原创 2018-07-12 21:01:01 · 1141 阅读 · 4 评论 -
机器学习笔记(二):一个完整的机器学习项目(上)
开篇依旧是机器学习实用指南的笔记,这边主要是第二章节的内容,希望通过代码和一些实例带大家去了解一个完整的机器学习项目,笔记主要是提炼要点,想要看原文的请点击。主要步骤:项目概述。 获取数据。 发现并可视化数据,发现规律。 为机器学习算法准备数据。 选择模型,进行训练。 微调模型。 给出解决方案。 部署、监控、维护系统。(未完6.8更新)...原创 2018-06-08 15:03:21 · 3111 阅读 · 0 评论 -
机器学习笔记代码分析(一):线性模型
开篇这里是sklearn与tf机器学习实用指南第一章节的示例代码分析。主要是一个线性模型,分析gdp和幸福指数的关系。数据处理源码和数据首先是幸福指数的数据oecd_bli = pd.read_csv(datapath + "oecd_bli_2015.csv", thousands=',')oecd_bli = oecd_bli[oecd_bli["INEQUALITY"]...原创 2018-06-07 19:59:31 · 2898 阅读 · 4 评论 -
机器学习笔记:机器学习概述
开篇刷了七天剑指offer,离实习和秋招越来越近了,要拾起一些东西了,博客都是逼出来的,希望实习前不会断更。这边主要是以代码为主,每天刷一个章节。主要内容来自于sklearn与tensorflow机器学习指南。目前还不知道书的内容坑不坑,但愿靠谱些,不至于让我看不下去。我只突出要点和代码,完整内容请点击上面的链接去看原书的翻译。...原创 2018-06-06 15:19:57 · 561 阅读 · 0 评论 -
机器学习中的隐变量和隐变量模型
开篇这篇博客算我自己给自己挖的一个坑,主要想讲讲机器学习中的隐变量,今天在推导EM算法,李航在统计学习方法中的EM引入中提到了隐变量的概念(latent variable),他提到了如果我们的概率模型的变量都是观测到的变量,那么给定数据,我们就可以使用极大似然估计法,或者其他估计法去估计参数,但是当模型有隐变量的时候,就该我们的EM算法闪亮登场了。这边我先介绍一下什么是隐变量。后续关于隐变量模...原创 2018-05-05 16:33:55 · 25754 阅读 · 10 评论 -
机器学习面试题解(6-10)
1、HMM的三个基本问题先放上我完整理论的一些博客https://blog.csdn.net/Ding_xiaofei/article/details/81629479前一段时间刚刚复习过,但还是有一个想不起来了,在面试官的提醒下才答出来的。概率计算问题,已知HMM模型参数,和观测值,计算观测值出现的概率学习问题,已知观测序列,计算HMM的模型参数预测问题,解码问题,我们平时用的最多...原创 2018-09-19 14:34:56 · 343 阅读 · 0 评论