数据挖掘
随风奔跑之水
理想是光明的,道路是曲折的,劲头是不可阻挡的
展开
-
常用数据挖掘算法整理
1、热度算法和个性化推荐http://www.woshipm.com/pmd/723735.html原创 2020-07-14 17:28:25 · 326 阅读 · 0 评论 -
文本类数据分词、词频、标签
1、贝叶斯案例3:文本关键词提取、新闻分类(python实现)https://blog.csdn.net/PbGc396Dwxjb77F2je/article/details/78786984转载 2020-07-01 10:18:51 · 408 阅读 · 0 评论 -
Spark大数据商业案例(wifi探针数据分析)
wifi探针数据分析本项目实现的主要功能:通过探针设备采集可监测范围内的手机MAC地址、与探针距离、时间、地理位置等信息: 探针采集的数据可以定时发送到服务端保存: 利用大数据技术对数据进行人流量等指标的分析。最终以合理的方式展示数据处理结果。1、数据收集数据收集由服务器和探针设备共同完成,探针采集数据并发送到服务器,服务器接收探针设备的数据,处理成定格式保存至分布式文件系统(H...转载 2019-05-20 18:32:37 · 2939 阅读 · 2 评论 -
机器学习之数据清洗(ETL)
数据清洗(ETL) pandas数据清洗:https://blog.csdn.net/weixin_40873462/article/details/89541499数据清洗是将重复、多余的数据筛选清除,将缺失的数据补充完整,将错误的数据纠正或者删除,最后整理成为我们可以进一步加工、使用的数据。所谓的数据清洗(ETL),包含抽取Extract、转换Transform、加载loa...原创 2019-05-16 14:26:56 · 5105 阅读 · 0 评论 -
机器学习之数据预处理
数据预处理1、数据特征 一列一特征 | v一行一样本 -> x x x x x \ y y y x x x x x | 样本矩阵 y y y ...原创 2019-05-16 16:11:51 · 400 阅读 · 1 评论