数据挖掘项目
文章平均质量分 94
macan_dct
一直在思考怎样才能有意义地过这一生,却发现时间从来没让我这么去做
展开
-
数据挖掘项目——新零售无人智能售货机商务数据分析
数据挖掘项目——新零售无人智能售货机商务数据分析一、 原始数据分析二、数据清洗1、处理附件12、处理附件2三、数据分析1、描述性分析2、数据可视化结果如下:一、 原始数据分析原数据中包含两个附件annex_1和annex_2。其中annex_1中有数据:订单号、设备ID、应付金额、实际金额、商品、支付时间、地点、状态、提现。具体如下:#原始数据detail = pd.read_csv('...原创 2021-12-09 16:41:51 · 6787 阅读 · 8 评论 -
数据挖掘项目:基于热水器的洗浴事件识别
数据挖掘项目——基于热水器的洗浴事件识别前言1. 项目描述2.处理流程数据探索性分析EDA数据预处理特征重做制作标签构建模型前言1. 项目描述本项目基于热水器采集的时间序列数据,将顺序排列的离散的用水时间节点根据水流量和停顿时间间隔划分为不同大小的时间区间,每个区间是一个可理解的一次完整用水事件,并以热水器一次完整用水事件为一个基本事件,将时间序列数据划分为独立的用水事件并识别出其中属于洗浴...原创 2020-04-03 15:12:05 · 1358 阅读 · 0 评论 -
数据挖掘——预测未来销售
数据挖掘——预测未来销售处理sale_train_v2.csv和test.csv处理shop.csv处理item_categories.csv处理items.csv特征添加该项目来自kaggle比赛,处理sale_train_v2.csv和test.csv1、读取训练数据:test = pd.read_csv("./test.csv") .set_index("ID")train = p...原创 2020-01-15 14:41:56 · 1647 阅读 · 0 评论 -
数据挖掘项目笔记——使用joblib中的Parallel并行运行程序
数据挖掘项目笔记——使用joblib中的Parallel并行运行程序joblib是一个可以使程序并行运行的包,并行运行程序可以大大提高运行效率。下面进行简单测试:import timefrom math import sqrtdef test_func_1(val): time.sleep(1) return sqrt(val**2)start_time = tim...原创 2020-01-09 22:56:50 · 2568 阅读 · 0 评论 -
数据挖掘项目——金融反欺诈
数据挖掘项目——金融反欺诈前言一、数据集获取二、特征工程1、读数据2、去除特殊字符3、删除属性4、提取标签三、构建模型前言该项目来自北风网,模型搭建很简单,该篇记录过程总结套路。一、数据集获取https://www.lendingclub.com/info/demand-and-credit-profile.action二、特征工程首先声明,该项目使用到的特征处理手段十分简单,但结果却...原创 2019-11-18 22:11:32 · 2096 阅读 · 0 评论