- 博客(7)
- 资源 (1)
- 收藏
- 关注
原创 机器学习第六篇——SVM
SVM全称支持向量机,为什么起这么个名字,这是因为数据集中有些样本被称为支持向量,在后面你就会知道。SVM是目前为止小编觉得较难的一个模型,因为这里面涉及带约束条件的最优化问题,小编也是看了一定的资料、视频才能理解一二。为了帮助更多的人更好的理解SVM,小编尽量使用通俗的文字、较少的数学公式来写这篇文章。一、SVM的目标讲解一个模型,最首要的是阐明模型的目标。SVM也是在二分类问题中找到一...
2018-08-30 10:59:03 759 1
原创 机器学习第五篇——神经网络
通过前面几篇的学习,我们了解了线性模型、逻辑回归、决策树的知识。下面就它们的应用领域和使用技巧进行说明。线性模型: 一般应用于回归问题上,适用于因变量和自变量之间有线性关系。 在小数据集上用正规方程求解简单、快速,在大数据集上可用梯度下降法求解。逻辑回归:一般应用于二分类问题。 分类器模型较简单,不能形成边界复杂的模型。决策树:决策树的最大缺点是原理中的贪心算法,因此它所做...
2018-08-25 19:47:26 529
原创 机器学习第三篇——分类决策树
决策树是一类常见的机器学习方法,利用决策树来进行决策的过程很像人类在面临决策问题时的一种思考模式。举个生活中的例子,假如我们要判断一个没剖开的西瓜是不是好瓜,有经验的瓜农可能会首先看看西瓜的颜色,再看看西瓜的根蒂形状,如果还没得出结论,可能还会敲打西瓜,听听是什么声音。上述过程用决策树表示如下。那么我们的问题来了,给你一份带分类标签的数据,你怎么训练出一棵决策树。再次回顾我们是怎样利用决策...
2018-08-18 16:08:34 560
原创 机器学习之离散值处理
前面我们学习了分类决策树,下面我们以周志华的机器学习书上的西瓜数据作为训练集练习以下,数据集如下。X = [ ['青绿', '蜷缩', '浊响', '清晰', '凹陷', '硬滑'], ['乌黑', '蜷缩', '沉闷', '清晰', '凹陷', '硬滑'], ['乌黑', '蜷缩', '浊响', '清晰', '凹陷', '硬滑'], ['青绿', '蜷缩',...
2018-08-18 11:51:31 8534 1
原创 机器学习第二篇——逻辑回归
前面介绍了机器学习中最简单的线性回归模型,机器学习第一篇——线性模型。今天,我们就来看看传说中的逻辑回归(logistic regression)。大家首先想一想,如果我们想要用已求得的线性模型来完成对样本的二分类,一个最简单的做法如下。这样虽然可以完成对数据样本的分类,但这样的分类有许多的弊端:没有体现输出值越大的样本属于正样本的可能性越大; 分类函数其实是单位阶跃函数,不具有...
2018-08-16 11:31:57 6613 1
原创 机器学习第一篇——线性模型
在写线性模型之前,我先概述下普通的最小二乘法。一、最小二乘法最小二乘法就是普通的无约束优化问题,具体请看吴立德教授的 https://www.bilibili.com/video/av10289610/?p=17.有了最小二乘法的概念,我们再来看看机器学习中的线性模型。二、线性模型 由于线性模型的函数是凸函数,所以它的最优化解的一阶充分必要条件为一阶导数为0。三、L...
2018-08-13 15:07:33 1007
原创 百度指数和谷歌趋势
最近小编一直在看项亮编写的《推荐系统实践》,在看到结合时间效应进行推荐的部分,发现了一个很有意思的网站工具——Google Trends。谷歌趋势 (Google Trends)是Google推出的一款基于搜索日志分析的应用产品,它通过分析Google全球数以十亿计的搜索结果,告诉用户某一搜索关键词各个时期下在Google被搜索的频率和相关统计数据。当我想到百度也是做搜索的,那么百度应...
2018-08-04 15:38:02 10515
车牌识别字符识别图片集
2018-05-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人