![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘学习笔记
lazy_wzyuan
一个想靠近大数据的小萌新。
展开
-
Python数据挖掘入门与实践学习笔记(一)
Python数据挖掘入门与实践学习笔记(一)基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集合源码可以去图灵社区下载。一、亲和性分析1、数据集分析1)首先,亲和性分析就是根据个体间的相似度,确定他们之间的亲密度。2)原数据集的维度为(100,5),这五列分别代表了面包、牛奶、奶酪、苹果和香蕉。行代表的是个体,列代表的是特征。用一段代码分析该数据集。import nu...原创 2019-07-16 22:39:24 · 432 阅读 · 0 评论 -
Python数据挖掘入门与实践学习笔记(二)
第二章 用scikit-learn估计器分类基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集和源码可以去图灵社区下载。一、scikit-learn 估计器scikit-learn把分类、聚类、回归分析等功能封装成估计器。估计器主要包括以下两个函数:fit(): 训练算法,设置内部参数。主要接收训练集,及其类别两个参数。predict(): 参数为测试集。预测测试集类别...原创 2019-07-17 16:28:58 · 316 阅读 · 0 评论 -
Python数据挖掘入门与实践(四)之Apriori算法推荐电影
第四章 用亲和性分析方法推荐电影基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集和源码可以去图灵社区下载。一、Apriori算法数据挖掘十大算法之Apriori详解Apriori算法是一种用于关联规则挖掘(Association rule mining)的代表性算法,关联规则挖掘是数据挖掘中的一个非常重要的研究方向,也是一个由来已久的话题,它的主要任务就是设法发现事物之间...原创 2019-07-19 20:31:40 · 4261 阅读 · 2 评论 -
Python数据挖掘入门与实践(三)之用决策树预测获胜球队
第3章:用决策树预测获胜球队基于《python数据挖掘入门与实践》这一书的学习笔记,其中数据集和源码可以去图灵社区下载。一、关于数据集根据书中的事例,使用NBA2013-2014赛季的比赛数据。https://www.basketball-reference.com/leagues/NBA_2014_games.html按照书中的方式已经下载不到数据了,因为原网站已经做了改版。因此,本人...原创 2019-07-17 21:16:29 · 2992 阅读 · 1 评论