Machine-Learning
文章平均质量分 96
柚子一只
好看的皮囊千篇一律,有趣的灵魂二百多斤
展开
-
机器学习--决策树算法
一、决策树是什么? 决策树(decision tree)是一种基本的分类与回归方法。举个通俗易懂的例子,如下图所示的流程图就是一个决策树,长方形代表判断模块(decision block),椭圆形成代表终止模块(terminating block),表示已经得出结论,可以终止运行。从判断模块引出的左右箭头称作为分支(branch),它可以达到另一个判断模块或者终止模块。我们还可以这...原创 2018-12-05 18:57:07 · 511 阅读 · 0 评论 -
准确率(Precision)、召回率(Recall)、F值对于模型的评估
一、有哪些模型评估方法?在机器学习、数据挖掘、推荐系统完成建模之后,需要对模型的效果做评价。业内目前常常采用的评价指标有准确率(Precision)、召回率(Recall)、F值(F-Measure)等,下图是不同机器学习算法的评价指标。下文讲对其中某些指标做简要介绍。倾向于使用准确率,是因为熟悉它的定义,而不是因为它是评估模型的最佳工具! 精度(查准率)和召回率(查全率)...原创 2019-04-15 16:32:12 · 4319 阅读 · 0 评论 -
基于用户的协同过滤推荐算法原理和实现分析
本文转载自nieson 基于用户的协同过滤推荐算法原理和实现 在推荐系统众多方法中,基于用户的协同过滤推荐算法是最早诞生的,原理也较为简单。该算法1992年提出并用于邮件过滤系统,两年后1994年被 GroupLens 用于新闻过滤。一直到2000年,该算法都是推荐系统领域最著名的算法。 本文简单介绍基于用户的协同过滤算法思想以及原理,最后基于该算法实现园友的推荐,即根据你关注...转载 2019-04-08 11:58:33 · 3758 阅读 · 1 评论 -
机器学习之推荐系统的基础知识
本文转载至博客园的小编周旭龙:初探机器学习之推荐系统的基础知识 一、推荐系统是神马维基百科这样解释道:推荐系统属于资讯过滤的一种应用。推荐系统能够将可能受喜好的资讯或实物(例如:电影、电视节目、音乐、书籍、新闻、图片、网页)推荐给使用者。 推荐系统的基本流程有哪些: Step1.首先收集用户的历史行为数据 Step2.然后通过预处理的方法得到用户-评价矩阵 St...转载 2019-04-08 11:37:30 · 550 阅读 · 0 评论 -
机器学习算法与Python实践之(七)逻辑回归(Logistic Regression)
本文转载至机器学习算法与Python实践之(七)逻辑回归(Logistic Regression)机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python,然后也想对一些机器学习算法加深下了解,所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍,所以就参考这本书的过程来学习了。 这节学习的是逻辑回归...转载 2019-03-28 20:24:28 · 585 阅读 · 0 评论 -
机器学习常见算法思想的面试宝典
本文转载自机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面...转载 2019-04-06 16:09:06 · 353 阅读 · 0 评论 -
解析损失函数、代价函数、目标函数
一、损失函数、代价函数、目标函数定义首先给出结论:损失函数(Loss Function )是定义在单个样本上的,算的是一个样本的误差。代价函数(Cost Function )是定义在整个训练集上的,是所有样本误差的平均,也就是损失函数的平均。目标函数(Object Function)定义为:最终需要优化的函数。等于经验风险+结构风险(也就是Cost Function + 正则化项)...原创 2019-03-27 19:22:28 · 1944 阅读 · 0 评论 -
数据预处理之数据标准特征化
Standardization即标准化,尽量将数据转化为均值为零,方差为一的数据,形如标准正态分布(高斯分布)。实际中我们会忽略数据的分布情况,仅仅是通过改变均值来集中数据,然后将非连续特征除以他们的标准差。sklearn中 scale函数提供了简单快速的singlearray-like数据集操作。一、标准化,均值去除和按方差比例缩放(Standardization, or mean remo...原创 2019-03-02 13:30:46 · 992 阅读 · 0 评论 -
Sklearn-RandomForest随机森林参数及实例
本文转载至Sklearn-RandomForest随机森林参数及实例在scikit-learn中,RandomForest的分类类是RandomForestClassifier,回归类是RandomForestRegressor,需要调参的参数包括两部分,第一部分是Bagging框架的参数,第二部分是CART决策树的参数。sklearn官网地址(RandomForestClassifier...转载 2019-03-02 12:50:00 · 1260 阅读 · 0 评论 -
随机森林算法工作原理
随机森林是一种灵活且易于使用的机器学习算法,即便没有超参数调优,也可以在大多数情况下得到很好的结果。它也是最常用的算法之一,因为它很简易,既可用于分类也能用于回归任务。 在这篇文章中,你将了解到随机森林算法的工作原理以及适用范围。 机器学习算法之随机森林算法工作原理随机森林是一种有监督学习算法。 就像你所看到的它的名字一样,它创建了一个森林,并使它拥有某种方式随机性。 所构建的“森...原创 2019-02-27 16:42:55 · 8163 阅读 · 1 评论 -
机器学习--Logistic回归之梯度上升算法
一、Logistic回归与梯度上升算法Logistic回归是众多分类算法中的一员。通常,Logistic回归用于二分类问题,例如预测明天是否会下雨。当然它也可以用于多分类问题,不过为了简单起见,本文暂先讨论二分类问题。首先,让我们来了解一下,什么是Logistic回归。1、Logistic回归假设现在有一些数据点,我们利用一条直线对这些点进行拟合(该线称为最佳拟合直线),这个拟合过程就...原创 2019-02-22 11:28:54 · 406 阅读 · 0 评论 -
机器学习--K-近邻(KNN)算法
一、简单k-近邻算法本文将从k-近邻算法的思想开始讲起,使用python3一步一步编写代码进行实战训练。并且,我也提供了相应的数据集,对代码进行了详细的注释。除此之外,本文也对sklearn实现k-近邻算法的方法进行了讲解。实战实例:电影类别分类、约会网站配对效果判定、手写数字识别。本文出现的所有代码和数据集,均可在我的github上下载,欢迎Follow、Star:Github代码地址...转载 2018-12-10 15:55:30 · 960 阅读 · 0 评论 -
机器学习--朴素贝叶斯分类函数
一、前言朴素贝叶斯算法是有监督的学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。该算法的优点在于简单易懂、学习效率高、在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。本篇文章将从朴素贝叶斯推断原理开始讲起,通过实例进行辅助讲解。最后,使用...原创 2018-12-06 16:09:25 · 1744 阅读 · 0 评论 -
数据处理时如何解决噪声数据?
一、什么是噪声 在机器学习中我们在独立随机抽样的时候会出现一些搞错的信息,这些错误的数据我们称之为杂讯(或者噪音 noise),一般可以归结为一下两种(以二分为例):输出错误:1.同样的一笔数据会出现两种不同的评判 2.在同样的评判下会有不同的后续处理。输入错误:1.在收集数据的时由于数据源的随机性会出现错误(比如说,客户在填信息的时候出现的误填)实际应...原创 2019-04-30 10:08:05 · 36175 阅读 · 1 评论