数据挖掘
文章平均质量分 86
数据挖掘系统理论知识
晴天qt01
学习笔记
展开
-
【机器学习算法】模型评估 “神经网络,聚类,向量机,关联规则”算法模型的评估。
数据集的切割,训练测试数据集的切割方式、交叉验证的方法,分类模型的评估混淆矩阵,等决策点的评估,ks图,提升图等模型的评估原创 2023-01-31 20:53:00 · 873 阅读 · 4 评论 -
【机器学习算法】序列模式 序列模式的概念,构建模式的算法:Aprioriall算法和SrefixSpan算法
本文内容为:序列模式的概念,了解序列模式的评估指标,Aprioriall算法和SrefixSpan算法原创 2022-09-02 17:59:47 · 2161 阅读 · 34 评论 -
【机器学习算法】关联规则-3 关联规则的指标问题和关联规则的使用方法
关联规则的指标需要用那几类,关联规则如何使用。原创 2022-08-21 22:07:53 · 2253 阅读 · 30 评论 -
【机器学习算法】关联规则2 FPgrowth法算法
Apriori算法的提升,Fpgrowth原创 2022-08-14 21:15:09 · 950 阅读 · 16 评论 -
【机器学习算法】关联规则-1 关联规则的概念,Apriori算法,实例和优缺点
关联规则的概念,关联规则的两个指标,支持度和置信度,apriori的算法原创 2022-08-13 17:57:32 · 3717 阅读 · 19 评论 -
【机器学习算法】聚类算法-4 模糊聚类 密度聚类,如何判断超参数:数据群数
EM作为数据挖掘公认的必学算法之一,不来看看吗原创 2022-08-07 23:55:40 · 2218 阅读 · 71 评论 -
【机器学习算法】聚类算法-3 K均值聚类法,PAM法,神经网络聚类法SOM
说明一下3个比较有名的划分聚类法,K-means,PAM,SOM,这3个在python等软件资源最多,原创 2022-08-06 11:10:45 · 3163 阅读 · 30 评论 -
【机器学习算法】聚类分析-2 聚类算法的分类,层次聚类算法的选择
聚类方法可以分为排他的聚类方法和非排他的聚类方法,排他的聚类方法,相当于一个资料点,只能属于于一个群。非排它的聚类方法,一个资料点可以属于多个群原创 2022-08-02 16:34:08 · 2417 阅读 · 38 评论 -
【机器学习算法】聚类分析-1 聚类是什么,我们如何确定类别间的相似性或者相异性
聚类分析虽然没有目标变量,但是你的思想,内心要有目标。要求根据分析者的目标来进行分群。原创 2022-07-31 23:37:40 · 3253 阅读 · 38 评论 -
【机器学习算法】集成学习-2 三个臭皮匠顶一个诸葛亮,弱学习器的机器学习元算法
我们发现即使是弱分类器组合的模型,即使是组合投票的结果模型,居然可以胜过我们多个强学习器的融合学习。原创 2022-07-31 16:45:51 · 1243 阅读 · 28 评论 -
【机器学习算法】集成学习-1 强学习器的融合学习
集成学习认为多个决策者比一个决策者可能会做出更好的决策,各种模型的整合也是如此,机器学习这种多样化就是通过集成学习的技术实现的。原创 2022-07-29 23:47:57 · 789 阅读 · 24 评论 -
【机器学习算法】支持向量机(support Vector Machine,SVM)
支持向量机SVM概述,核函数特征转换处理非线性问题,多分类SVM问题原创 2022-07-29 10:41:23 · 2454 阅读 · 54 评论 -
【机器学习算法】神经网络与深度学习-9 递归神经网络(Recurrent Neural Networks,RNN)
递归神经网络RNN,用来解决序列型,有滞后性问题的神经网络原创 2022-07-28 19:48:42 · 561 阅读 · 25 评论 -
【机器学习算法】神经网络与深度学习-8 1.1.1 CNN卷积神经网络(Convolutional neural Networks )详解
卷积神经网络 CNN,卷积层,池化层详细说明原创 2022-07-28 10:22:01 · 931 阅读 · 54 评论 -
【机器学习算法】神经网络与深度学习-7 DNN深度学习算法模型出现学习效果不好的情况,如何补救,对策如下,建议收藏。
我们训练一个普通深度学习网络(Deep Nural Networks DNN)的时候很难一帆风顺,直接达到最好结果,这里对各种学习效果不好情况,提供对策。原创 2022-07-27 18:22:02 · 1874 阅读 · 34 评论 -
【机器学习网络】神经网络与深度学习-6 深度神经网络(deep neural Networks DNN)
深度神经网络(deep neural Networks DNN)原创 2022-07-26 19:02:30 · 1592 阅读 · 55 评论 -
【机器学习算法】神经网络与深度学习-5 深度学习概述
深度学习概述,为之后普通深度网络DNN和深度信念网络DBN(会在自动特征学习中说其中的一种,它的变型太多了)和卷积神经网络CNN,打下框架原创 2022-07-25 23:55:21 · 461 阅读 · 25 评论 -
【机器学习算法】神经网络和深度学习-4 重要的BP网络使用总结,了解BP神经网络的魅力
为什么我们把神经网络叫做黑盒子(black box),BP神经网络能解决哪几种类型的问题。本篇文章进行了总结原创 2022-07-25 12:30:21 · 1409 阅读 · 32 评论 -
【机器学习算法】神经网络与深度学习-3 BP神经网络
BP神经网络无需提前了解字段与输出字段关系的算法模型,近几年人工智能,深度学习的基础。原创 2022-07-24 23:40:11 · 6284 阅读 · 70 评论 -
【机器学习算法】神经网络与深度学习-2 由感知机到BP神经网络的内容
来谈谈人工智能的里程碑BP神经网络是如何得到的,也就是如何从感知机到BP神经网络。谈谈使用激活函数的几种情况原创 2022-07-24 17:11:37 · 246 阅读 · 13 评论 -
【机器学习算法】神经网络和深度学习-1 神经网络概述和感知机介绍
神经网络与深度学习是最近的热门话题,产生了很多人工智能上的应用。神经网络概述和感知机介绍原创 2022-07-24 11:16:38 · 739 阅读 · 23 评论 -
【机器学习算法】决策树-6 PRISM
PRISM决策规则。增加决策树可解读性的好用算法。建议了解原创 2022-07-23 18:54:52 · 795 阅读 · 4 评论 -
【机器学习算法】决策树-5 CART回归树法,M5回归树算法对CART算法改进了什么
数据挖掘十大必学算法之一:决策树CART的回归树内容,已经CART加强版的M5算法内容原创 2022-07-23 16:02:48 · 913 阅读 · 16 评论 -
【机器学习算法】决策树-4 CART算法和CHAID算法
数据挖掘领域必须熟悉的十大经典算法也包括CART算法,另外这里也说明了统计学家发明的CHAID分类算法,同样很重要。利用案例说明了如何使用。原创 2022-07-22 22:41:37 · 2398 阅读 · 10 评论 -
【机器学习算法】决策树-3 C4.5的字段选择方法,C4.5的数值型字段处理方式、C4.5的剪枝(避免过拟合)方法
数据挖掘十大必学数据挖掘算法,C4.5就是其中一种,建议了解。本文将C4.5分类树算法用案例进行说明。原创 2022-07-22 18:58:46 · 630 阅读 · 2 评论 -
【机器学习算法】决策树-2 ID3分类树算法的决策依据,ID3算法的4大缺点。
ID3分类树算法的原理与分类依据。ID3分类树的4大缺点。原创 2022-07-22 15:44:37 · 1006 阅读 · 9 评论 -
【机器学习算法】决策树-1(分类树及回归树的基本原理)
分类树和决策树的解释和基本原理原创 2022-07-21 23:12:06 · 1852 阅读 · 0 评论 -
【机器学习算法】朴素贝叶斯算法,该算法有非常好的特性,在big data的情况下,它支持数据更新和数据逐渐更改。
朴素贝叶斯算法,是最简单的机器学习算法,但是它的效果有出奇的好。本文说明的朴素贝叶斯中可能出现的问题,如何处理,并python中数据概率的求法进行了说明。原创 2022-07-21 19:04:14 · 997 阅读 · 9 评论 -
【自然语言处理与文本分析】非结构文本转结构数据。BP神经网络,反向传播神经网络,神经网络优化的底层原理,梯度优化法
BP神经网络如何选择隐藏层数量。BP神经网络说明,其中反向传播神经网络如何优化权重,神经网络优化的底层原理:梯度优化法说明原创 2022-07-21 00:47:06 · 377 阅读 · 0 评论 -
【自然语言处理与文本分析】word2Vec(有监督神经网络模型)的两个子模型skip-gram和CBOW模型。
神经网络的基本原理和,word2vec的文章(有监督神经网络模型)的两个子模型skip-gram和CBOW模型。案例介绍和说明。原创 2022-07-20 17:31:59 · 395 阅读 · 2 评论 -
【自然语言处理与文本分析】PCA文本降维。奇异值分解SVD,PU分解法。无监督词嵌入模型Glove。有案例的将文本非结构化数据转化为结构化数据的方法。
将文本非结构化数据转化为结构化数据的方法无监督GLove词嵌入模型。(还有PCA和SVD,PU这种好用的方法的具体解读)原创 2022-07-19 23:58:51 · 1513 阅读 · 1 评论 -
【自然语言处理与文本分析】在进行文本非结构数据转结构数据时为什么我们词袋模型不使用one-hot-encoding模型,如何改进。
震惊!小伙用one hot encoding把文本非结构化数据结构化居然出现这种情况,让我们看看他如何解决原创 2022-07-19 17:11:00 · 419 阅读 · 0 评论 -
【自然语言处理与文本分析】文本特征提取方法总结。关键词提取方法。公认效果较好的IDF,RCF。
文本特征,也就是关键词,是文章想表达的主要画图,能反映文本语料主题的词语或者短语。原创 2022-07-18 17:02:36 · 1735 阅读 · 0 评论 -
【自然语言处理和文本分析】基础信息检索:签名文件技术,进阶信息检索:向量空间技术(目前主流的搜索引擎在用的技术)
文本挖掘其实就是自然语言处理+数据挖掘。今天讲的是基础信息检索:签名文件技术,进阶信息检索:向量空间技术(目前主流的搜索引擎在用的技术)原创 2022-07-18 15:24:00 · 379 阅读 · 0 评论 -
【自然语言处理和文本分析】基本信息检索技术中的全面扫描法和逐项翻转法。
基本信息检索技术和逐项翻转法。原创 2022-07-17 23:44:34 · 183 阅读 · 0 评论 -
【自然语言处理与文本分析】用两个项目案例介绍文本挖掘方法论。
文本挖掘是一项非常困难的工作,因为它必须处理那些本来就模糊而且非结构化的 文本数据 ,所以它是一个多 学科 混杂的领域,涵盖了 信息技术 、文本分析、 模式识别 、 统计学 、 数据可视化 、 数据库技术 、 机器学习 以及数据挖掘等 技术.........原创 2022-07-17 16:06:10 · 1803 阅读 · 0 评论 -
【自然语言处理与文本分析】中文分词的基本原理,如何进行词性标注 使用HMM算法提高准确率
中文分词是文本处理必不可少的一部分,词性标注对后续的关键词截取和词云图绘制是非常有帮助的原创 2022-07-16 18:20:11 · 1577 阅读 · 5 评论 -
【自然语言处理与文本分析】自然语言处理概要
在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的信息量是最大的。为了能够分析和利用这些文本信息,我们就需要利用 NLP 技术,让机器理解这些文本信息,并加以利用。...原创 2022-07-15 22:10:48 · 1537 阅读 · 0 评论 -
【特征学习】以深度学习和词嵌入为基础的特征学习
深度学习和词嵌入为基础的特征学习原创 2022-07-15 15:04:41 · 300 阅读 · 0 评论 -
【特征学习】利用关联规则和神经网络进行建立新特征
运用关联规则和神经网络,自动学习新特征原创 2022-07-14 22:55:10 · 726 阅读 · 0 评论