机器学习算法
西湖太极熊
一切用数据说话,用产品触达心灵!
展开
-
数据分析书籍赠送,让你快速进阶!
赠书活动开启!大家好,最近整理了一些数据分析必备且非常经典的书单,这些书都是数据分析入门非常实用的书籍。书籍主要分6类:1、数据分析基础2、数据化管理3、python数据分析4、用户画像5、机器学习6、产品经理详细书籍分类及名称如下:这几类书籍是一个比较标准的进阶过程,首先,数据分析基础的学习对后续数据分析是一个基础沉淀,然后通过学习数据化管理了解通过数据来驱动业务进行管理,然后进一步通过学习python来进行数据分析和挖掘,然后详细了解用户画像的分析方法论可以更好的帮助数据挖掘,然原创 2021-03-31 22:16:41 · 188 阅读 · 0 评论 -
数据分析
机器学习Python 可以说是现在最流行的机器学习语言,而且你也能在网上找到大量的资源。你现在也在考虑从 Python 入门机器学习吗?本教程或许能帮你成功上手,从 0 到 1 掌握 Python 机器学习,至于后面再从 1 到 100 变成机器学习专家,就要看你自己的努力了。本教程原文分为两个部分,机器之心在本文中将其进行了整合,原文可参阅:7 Steps to Mastering Mach...原创 2018-04-20 09:54:59 · 482 阅读 · 0 评论 -
数据挖掘十大经典算法原理
数据挖掘十大经典算法一、 C4.5C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 2) 在树构造过程中进行剪枝; 3) 能够完成对连续属性的离散化处理; 4) 能够对不完整数据...转载 2018-02-23 14:06:20 · 3912 阅读 · 0 评论 -
机器学习算法与Python实践之(五)k均值聚类(k-means)
一、k-means算法 通常,人们根据样本间的某种距离或者相似性来定义聚类,即把相似的(或距离近的)样本聚为同一类,而把不相似的(或距离远的)样本归在其他类。 我们以一个二维的例子来说明下聚类的目的。如下图左所示,假设我们的n个样本点分布在图中所示的二维空间。从数据点的大致形状可以看出它们大致聚为三个cluster,其中两个紧凑一些,剩下那个松散一些。我们的目的是为转载 2017-10-18 20:40:28 · 634 阅读 · 0 评论 -
机器学习笔记一:K邻近算法心得!
一、kNN算法概述 K最近邻(k-Nearest Neighbor,KNN)分类算法。它主要测量不同特征值之间的距离方法进行分类。思想很简单:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 比如上面这个图,我们有两类数据,分别是蓝色方块和红色三角形,他们分布在一个上图的二维中间中。那么假如原创 2017-10-18 20:47:54 · 452 阅读 · 0 评论 -
kNN邻近算法逻辑思路和可分析示例思考?
KNN邻近算法原理:1、KNN主要是通过已知分类,然后通过未知的数据与其进行距离测算,然后通过给定的距离范围里面包含的数据量K,进行排序,数据距离最近的K个数里面,类型数目最多的就是校验的样本的类型。2、然后通过使用所有列的最大数据减去最小数,然后样本除于这个最大间距,来实现数据归一化,防止样本数据值相差太大,导致数据误差偏大,然后重新计算测试样本。3、其次在有一个数据源时,利用10%原创 2017-10-19 17:38:51 · 339 阅读 · 0 评论 -
机器学习算法应用场景
本文整理了60个机器学习算法应用场景实例,含分类算法应用场景20个、回归算法应用场景20个、聚类算法应用场景10个以及关联规则应用场景10个。包含了天池、DataCastle、DataFountain中所有竞赛场景。目录1 分类算法应用场景实例1.1 O2O优惠券使用预测1.2 市民出行选乘公交预测1.3待测微生物种类判别转载 2017-10-22 11:06:35 · 3429 阅读 · 0 评论 -
机器学习算法与Python实践之(五)k均值聚类(k-means)原理补充
Mean-shift 1)概述 Mean-shift(即:均值迁移)的基本思想:在数据集中选定一个点,然后以这个点为圆心,r为半径,画一个圆(二维下是圆),求出这个点到所有点的向量的平均值,而圆心与向量均值的和为新的圆心,然后迭代此过程,直到满足一点的条件结束。(Fukunage在1975年提出) 后来Yizong Cheng 在此基础上加入了 核函数 和 权重系数 ,使得Mean-shift原创 2017-11-08 09:36:19 · 330 阅读 · 0 评论 -
机器学习十大算法原理总结
1、K-近邻算法:通过建立和样本之间的距离求和,然后通过选择最近的K个样本数据,样本数据类型多的就是需要分的类型。 2、决策树算法:通过求最大信息增益来得到需要判断和拆分的标签类目,然后建立递归数,进行继续拆分到叶子节点结束。 3、朴素贝叶斯算法:通过和全量样本对比,有不同的样本概率求和,选择概率最大的作为分类。原创 2017-11-11 21:36:49 · 3109 阅读 · 0 评论 -
K-邻近算法
导入的包coding=UTF8from numpy import *import operatorfrom os import listdirimport matplotlibimport matplotlib.pyplot as plt判断数据是哪一个类型def classify0(inX, dataset, labels, k):dataSetSize = dataset.shape原创 2017-11-28 15:06:30 · 306 阅读 · 0 评论 -
机器学习算法原理和思路
机器学习原理总结梳理,持续更新... ...!原创 2017-10-20 17:51:23 · 403 阅读 · 0 评论