机器学习
wszhou1997
为世界之光
展开
-
主成分分析(PCA)算法实现iris数据集降维
主成分分析(PCA)算法1.PCA简介:PCA(Principal Component Analysis),主成分分析,是一种常用的数据降维算法。数据降维是指对高维度特征数据进行处理,保留重要的特征,去除噪声和不必要的特征,以达到提升 数据处理速度的目的。PCA的主要思想是将原有数据的n维特征映射到k维上(k<n),这k维是全新的正交特征,也被称作主成分。PCA的工作是从原空间中找出一...原创 2019-10-15 20:21:16 · 5999 阅读 · 0 评论 -
朴素贝叶斯实现文档分类
朴素贝叶斯实现文档分类网上与朴素贝叶斯相关的内容很多,本文仅作为作业的记录博客,重点记录在实现作业过程中遇到的问题和解决方法。作业要求:实验数据在bayes_datasets文件夹中。其中, train为训练数据集,包含hotel和travel两个中文文本集,文本为txt格式。hotel文本集中全部都是介绍酒店信息的文档,travel文本集中全部都是介绍景点信息的文档; Bayes...原创 2019-10-05 18:58:30 · 1283 阅读 · 4 评论 -
pycharm使用tensorflow时的一些问题
pycharm使用tensorflow时的一些问题本人使用pycharm创建tensorflow项目时遇到问题如下:在第一个项目project1中安装了tensorflow,在第二个项目project2中却提示未安装tensorflow经考虑,得出结论:在使用pycharm创建项目时,要选择已存在的解释器,而不要选择新建虚拟环境如图所示,在新建项目时选择New environment ...原创 2019-08-03 10:34:43 · 782 阅读 · 0 评论 -
FP-growth算法以及代码实现
FP-growth算法以及代码实现FP-growth算法介绍FP-growth算法,它被用于挖掘频繁项集,它把数据集存储为一个叫FP树的数据结构里,这样可以更高效地发现频繁项集或频繁项对。FP树FP即Frequent Pattern,FP树看上去就是一棵前缀树,根节点是空集,结点上是单个元素,保存了它在数据集中的出现次数,出现次数越多的元素越接近根。此外,结点之间通过链接(link)相连,...原创 2019-11-25 19:01:46 · 4049 阅读 · 3 评论 -
决策树学习笔记
决策树**熵:**热力学中表征物质状态的参量之一,用符号S表示,其物理意义是体系混乱程度的度量**信息熵:**离散随机事件出现的概率。一个系统越是有序,信息熵越低;反之,越是杂乱无章,信息熵越高。信息熵可以被认为是系统有序化程度的度量...原创 2019-11-18 11:53:47 · 263 阅读 · 0 评论