![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 91
Civilism
数据为王
展开
-
[数据挖掘] 关联规则 Apriori算法实现到PFP(paralled frequent pattern)算法
关联规则进行数据挖掘关联分析(Association analysis)理解:相关概念Apriori算法查找频繁项集根据频繁项集挖掘关联规则关联分析(Association analysis)理解:从大规模的数据中, 发现事物(物品)间的隐含关系的过程就是关联分析(association analysis)或者关联规则学习(association rule learning).是一种...原创 2021-02-01 14:41:01 · 979 阅读 · 1 评论 -
[数据挖掘] 决策树
数据挖掘--决策树 待更新 简介信息熵理解:决策树的优劣主要问题解决方案ID3算法简介训练过程信息增益的计算如何划分数据简介决策树, 举两个栗子:网络上各种心理测试的题, 根据你选的答案, 跳到另一题, 最后得出你是什么性格的人.图灵测试, 通过设计各种问题来问跟你聊天的人, 在20 个问题以内, 你来判断跟你聊天的是机器人还是人.以上, 都是决策树的一种形式, 看图就懂:判...原创 2018-11-03 19:13:59 · 405 阅读 · 0 评论 -
[数据挖掘] 朴素贝叶斯 以及西瓜集特征工程
朴素贝叶斯 以及西瓜数据集的特征工程朴素贝叶斯的基本思想朴素贝叶斯分类的过程数据集:版本1记录一下代码有多烂:评估版本2训练预测:结果即评估:版本3简介:数据集特征工程OneHotEncoder 与LabelEncoderpandas 给我弄晕了的方法:取值集合赋值特殊索引 *** 我记得numpy 也是这样代码朴素贝叶斯的基本思想先验概率: 通过已知事实, 推论出未知事务出现的概率例如:...原创 2018-11-12 15:55:36 · 3445 阅读 · 0 评论 -
[机器学习] 机器学习入门篇 从线性回归到手写逻辑斯蒂回归
如果你能认真看完这篇文章, 那么请联系我我送你小花花~手写实现逻辑回归1. 线性回归1.1 认识线性回归1.2 来, 吃个栗子1.3 多变量线性回归以及矩阵的表示1.4 线性回归的最优解:1.5 小结2 逻辑回归2.1 主题之前: 线性回归的广义化2.2 激活函数 sigmoid2.2 最优化逻辑回归(logistic regression)模型2.2.1 概率计算:2.2.2 损失函数的选择...原创 2018-11-25 22:51:38 · 358 阅读 · 0 评论 -
[数据挖掘] k-means聚类 算法进行图像分割
使用k-means算法对图像色块进行分割k-means 简单描述算法步骤k-means 简单描述算法步骤将rgb图像分割成 r g b三个通道, 分别进行处理(灰度图不需要).初始随机给定 k 个值, 我选择k位3, (k 要属于该图像颜色所在域 如 0-255);k值的选取会影响聚类的速度;对 r g b三个通道分别进行以下聚类处理:创建一个新的列表ks来存 k 个类中每个类...原创 2018-12-03 21:45:32 · 10512 阅读 · 9 评论 -
[数据挖掘] K-中心点 解决 k-means 的局部最优问题
k-中心点 基于代表的划分概述算法整体算法损失计算优化优点缺点讨论实现概述在 k-means, 我们使用了基于形心(簇均值)来对数据进行划分, 也讨论了 k-means 的初始值选取之重要, 若选得不好, 很容易陷入局部最优解的问题.实质上来说, 我们会陷入到局部最优解的本质原因是:当初始值选定之后, 我们有一个初始的簇均值基本是在这个簇的最大值与最小值之间每次更新的新的质心(均值)...原创 2019-01-10 01:58:40 · 9571 阅读 · 0 评论