机器学习
文章平均质量分 94
机器学习理论知识及python的sklearn库实现
努力再努力1
喜欢数据分析,对数据库、python等工具感兴趣!
展开
-
利用Kmeans聚类进行用户分层分析
利用Kmeans聚类法对超市的用户进行分层分析,特征包括:年龄、年收入和消费水平。先对数据进行大概的了解:数据分布、特征关系(气泡图),直方图等;最后分别根据双特征和三特征进行用户分层。...原创 2022-06-13 14:59:41 · 1894 阅读 · 0 评论 -
机器学习算法基本过程与优缺点总结
主要介绍了机器学习中的常见算法的基本过程和优缺点,进行学习前特征工程及结束模型训练和预测后的常见模型评价指标介绍。原创 2022-05-16 22:44:12 · 441 阅读 · 0 评论 -
机器学习之重要迭代算法梯度下降法
讲解了机器学习中的重要算法梯度下降法,用来求解无约束最优化问题的最小值问题。原创 2022-05-15 17:20:20 · 2135 阅读 · 0 评论 -
机器学习之随机森林
简单介绍了集成学习定义,典型的集成算法随机森林的过程,及利用sklearn实现随机森林及可视化。原创 2022-05-15 14:24:11 · 6602 阅读 · 0 评论 -
数据挖掘之关联分析Apriori算法
文章目录一、理论知识1.1、定义1.2、关联规则1.3、频繁项集的产生二、python实战一、理论知识许多商业企业在运营中积累了大量的数据。例如:普通超市的收银台每天都会收集到大量的用户购物数据。下表给出一个这样的例子,通常称为购物篮事务。每一行代表一个事务,包含唯一标识id和顾客购买的商品的集合。零售商对分析这些数据会感兴趣,因为这样可以了解到用户的购物行为,可以使用这种有价值的信息来支持各种商务应用,如市场促销,库存管理等。TID项集1{黄油 ,苹果,香蕉}2{面包,原创 2022-05-11 22:19:35 · 1387 阅读 · 0 评论 -
机器学习之决策树CART算法
接上期:文章目录一、理论知识1.0、特征选择:基尼指数1.1、决策树的生成1.2、CART剪枝二、python实战一、理论知识CART算法是给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法。CART假设决策树是二叉树,内部节点取值为“是”或“否”。这样的决策树等价于递归地二分每个特征,将特征空间划分为有限个单元,并在这些单元上确定预测的概率分布即输入给定的条件下输出的条件概率分布。1.0、特征选择:基尼指数分类树用基尼指数选择最优特征,同时决定该特征的最优二值切分点。分类问题中假原创 2022-05-10 20:32:40 · 10858 阅读 · 0 评论 -
机器学习之决策树
详细介绍了决策树的原理基本步骤及特征选择方法信息增益和信息增益比,决策树生成算法ID3和C4.5算法,决策树的剪枝。最终利用python实现决策树回归算法和分类算法。原创 2022-05-10 15:23:09 · 335 阅读 · 0 评论 -
机器学习之特征工程(特征选择)
简单介绍了进行数据挖掘和机器学习前的特征工程即数据预处理,包含过滤法、包装法和嵌入法三大方向的方法,其中包含相关系数法,方差选择法、卡方检验法,递归特征消除法等诸多方法,并且利用python进行实现。原创 2022-05-07 14:44:55 · 1534 阅读 · 0 评论 -
机器学习之特征工程(数据清洗)
介绍了常见的数据预处理方法:缺失值、重复值、异常值、离散化及标准化等处理,及python如何实现。原创 2022-05-06 22:05:43 · 1383 阅读 · 0 评论 -
机器学习之分类与回归的常见评价指标
详细介绍了机器学习中分类和回归算法的常见评价指标,如分类问题的精确率、准确率、召回率、F1值及ROC曲线;回归问题的决定系数、均方误差、平均绝对误差等。利用python实现评价指标的计算。原创 2022-05-05 18:10:08 · 3412 阅读 · 3 评论 -
机器学习之层次聚类与K-Means
介绍了常用聚类算法中的K均值与层次聚类法的基本原理及步骤,且利用sklearn实现聚类算法及可视化聚类结果。原创 2022-05-04 21:15:32 · 3211 阅读 · 0 评论 -
机器学习之分类方法K近邻(KNN)
详解KNN原理及步骤,针对K值的选取,距离度量法的选择进行说明,并利用sklearn对手写体进行预测。原创 2022-05-03 22:51:51 · 4034 阅读 · 8 评论 -
机器学习之降维方法PCA与因子分析
说明了主成分分析和因子分析的基本原理及区别,和PCA的python实现和sklearn调包实现。原创 2022-05-01 14:34:39 · 4319 阅读 · 0 评论 -
机器学习之朴素贝叶斯
详解朴素贝叶斯原理、优缺点、计算过程及python实现朴素贝叶斯模型。原创 2022-04-30 20:14:40 · 1032 阅读 · 0 评论 -
机器学习之线性回归
文章目录一、线性回归1、普通线性回归(Linear Regression)2、岭回归(Ridge Regression)3、套索回归(lasso回归)二、python实战0、导包 数据说明1、线性回归2、岭回归3、Lasso回归一、线性回归1、普通线性回归(Linear Regression)线性回归是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合(自变量都是一次方);只有一个自变量的情况称为一元原创 2022-04-30 07:30:00 · 2676 阅读 · 0 评论 -
机器学习之逻辑回归
学习目标:了解逻辑回归的理论掌握 逻辑回归 的 sklearn 函数调用使用一、逻辑回归简介想必大家都不喜欢数学推到公式,因此我在这里只是简单的描述一下逻辑回归算法的重要的知识点,喜欢数学公式推导的可以自行百度或查看统计学习方法(李航 著)。逻辑回归(Logistic regression,简称LR)虽然其中带有"回归"两个字,但逻辑回归其实是一个分类模型(主要用于二分类,也可以用于多分类),所以利用了Logistic函数(或称为Sigmoid函数),函数形式为:g(x)=11+e−x.原创 2022-04-29 11:20:05 · 192 阅读 · 0 评论