机器学习
文章平均质量分 94
机器学习从入门到精通
wyply115
这个作者很懒,什么都没留下…
展开
-
机器学习-10.K-means
1. 概述k-means为无监督学习,即没有目标值。k-means步骤计算到k中心的距离一般采用欧式距离进行计算。图解如下:API:sklearn.cluster.KMeansk-means的使用一般用于分类之前进行,在没有目标值,仅有历史的数据特征时,又想预测新数据的类别,可以先对历史数据进行聚类。2. kmeans性能评估评估指标:轮廓系数按照下图描述的外部距离...原创 2018-12-25 16:55:56 · 166 阅读 · 0 评论 -
机器学习-9.逻辑回归
逻辑回归是将线性回归的结果通过sigmoid函数映射到0到1的区间内,而[0,1]对应百分比即概率,从而转化为分类问题逻辑回归只能解决二分类问题。公式:hθ(x)=g(θTx)=11+e−θTxh_\theta(x) =g(\theta^Tx)=\frac{1}{1+e^{-\theta^Tx}}hθ(x)=g(θTx)=1+e−θTx1g(z)=11+e−zg(z)=\frac{1...原创 2018-12-25 16:02:36 · 204 阅读 · 0 评论 -
机器学习-8.线性回归
定义:原创 2018-12-23 17:09:46 · 262 阅读 · 0 评论 -
机器学习-7.决策树与随机森林
1. 认识决策树如上图所示,这就是一棵决策树。2. 信息论基础假设有32个球队比赛去猜冠军,在对球队没有任何了解时,需要猜几次肯定能猜到?,这个大家应该都知道,采用二分法的话最多5次就能猜到,用数学知识解答就是log32(以2为底)=5。那么在信息论中,32个球队,log32=5比特;64个球队,log64=6比特。比特来源:那么思考个问题,假设32个球队,你知道了很多球队的信息...原创 2018-12-18 18:00:17 · 255 阅读 · 0 评论 -
机器学习-6.朴素贝叶斯
1. 基础的概率知识条件概率和联合概率联合概率:包含多个条件,且所有条件同时成立的概率。记作:P( A , B ) = P(A)P(B)条件概率:就是事件A在另外一个事件B已经发生条件下的发生概率记作:P(A|B)特性:P(A1,A2|B) = P(A1|B)P(A2|B)公式成立条件:A1和A2两个事件或特征相互独立,不会互相影响的前提下。举例:有样本如下:...原创 2018-12-18 13:52:30 · 309 阅读 · 0 评论 -
机器学习-5.k-近邻算法(KNN)
定义:所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。白话来讲就是通过你的“邻居”来推断你的类别。上述概念中讲最临近,那如何求最临近?也就是如何求距离?两个样本的距离可通过如下公式进行计算,又叫做欧式距离。比如说,a(a1,a2,a3),b(b1,b...原创 2018-12-17 13:15:21 · 639 阅读 · 9 评论 -
机器学习-4.开发流程、算法基本认知
1. 机器学习开发流程我们作为机器学习的开发工程师首先要明确自己学习的定位,也就是确定学习边界。大部分复杂模型的算法设计都是由算法工程师去做的,我们只需要:分析很多的数据;分析具体的业务;应用常见的算法;特征工程、调参数、优化。我们学习应达到一下目的:学会分析问题、使用机器学习算法的目标,想要使得算法完成什么样的任务。掌握算法基本思想原理,学会对不同问题用对应的算法...原创 2018-12-15 15:46:31 · 749 阅读 · 0 评论 -
机器学习-3.数据特征预处理与数据降维
特征预处理定义:通过特定的统计方法(数学方法)将数据转换成算法要求的数据。处理方法数值型数据:标准缩放(1.归一化,2.标准化);缺失值。类别型数据:one-hot编码。时间类型:时间的切分。预处理API:sklearn.preprocessing1. 归一化特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间公式:X′=x−minmax−minX&am...原创 2018-12-15 14:40:32 · 621 阅读 · 0 评论 -
机器学习-2.特征工程和文本特征提取
1. 数据集的组成前面讲了,机器学习是从历史数据当中获得规律,那这些历史数据的组成是个什么格式?大都存储在哪里?– 在机器学习里大多数数据不会存在数据库中,大都存在文件中(比如csv文件)– 不存在数据库原因:1. 读取速度导致存在性能瓶颈。2. 存储的格式不太符合机器学习要求的数据格式。3. 由于我们有pandas,读取文件数据及处理速度非常快。– pandas为什么快?1. 基于nu...原创 2018-12-14 11:20:13 · 504 阅读 · 0 评论 -
机器学习-1.简介
1. 人工智能名人介绍人工智能之父:艾伦.图灵,其中一个重要的概念叫“图灵测试”:指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。在进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。马文.李.闵斯基,1956年发起“达特茅斯会议”并提出人工智能(artificial intel...原创 2018-12-13 14:19:51 · 212 阅读 · 0 评论