![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 95
zkinglin
这个作者很懒,什么都没留下…
展开
-
数据挖掘——决策树和K近邻
决策树和K近邻一、线性回归(房价预测)第1关:线性回归算法思想(一)相关知识1>简单线性回归2>多元线性回归(二)编程要求(三)参考答案第2关:动手实现线性回归(一)相关知识1>数据集介绍2>线性回归算法原理模型训练流程正规方程解3>线性回归算法流程(二)编程要求(三)参考代码第3关:衡量线性回归的性能指标(一)相关知识1>前言2>MSE3>RMSE4>MAE5>R-Squared(二)编程要求(三)参考代码二、决策树第1关:决策树算法思想(一)相原创 2021-04-25 19:41:00 · 3543 阅读 · 0 评论 -
数据挖掘——商品推荐和大数据处理
亲和性分析——商品推荐一、Hadoop云计算基础第1关:WordCount词频统计第2关:HDFS文件读写第3关:倒排索引第4关: 网页排序——PageRank算法二、亲和性分析——商品推荐第1关:使用 Numpy 加载文件中的数据(一)相关知识1>Numpy 是什么2>使用 Numpy 加载文件中的数据(二)编程要求(三)参考代码第2关:处理 Numpy 加载到的数据(一)相关知识1>将文字规则用数值表示2>处理从 Data 中获取的数据(二)编程要求(三)参考代码第3关:商品推荐原创 2021-04-16 13:47:52 · 3088 阅读 · 1 评论 -
数据挖掘——数据采集和数据清洗
数据采集和数据清洗一、数据清洗1.数据去重(一)相关知识1> pandas读取csv文件-read_csv()2> pandas的去重函数-drop_duplicates()(二)本关任务(三)参考代码2.处理空值(一)相关知识1> DataFrame中空值的表示2> 查找空值及计算空值的个数3> 处理空值-fillna(二)本关任务(三)参考代码一、数据清洗1.数据去重(一)相关知识1> pandas读取csv文件-read_csv()原创 2021-04-12 20:06:16 · 7448 阅读 · 4 评论 -
数据挖掘——数据可视化
数据可视化数据可视化第一关 数据可视化的内涵第二关 初识数据第三关 柱状图第四关 散点图第五关 直方图数据可视化进阶1>数据可视化是什么? 数据可视化是将数据和信息通过用图来表示展示其价值。直观来讲,常见画图的目的有:1.按区间划分的数据,进行比较;2.展现变量间的关系或分布;3.展现网络结果的节点、边、集群,寻找路径,找到影响力大的节点;4.表示关系,将相关性等属性用不同颜色展示;5.用字词大小展示频率、重要性;6.在 3原创 2021-04-04 18:36:05 · 6600 阅读 · 0 评论