Python
文章平均质量分 75
不得行
偏执就是力量
展开
-
利用神经网络识别窃电用户
目标: 识别用户是否存在窃电行为分析思路与流程: 识别用户是否存在窃电行为是预测模型中的分类问题,故采用分类模型 确定模型之后,需要根据模型的要求,归纳窃电用户的关键特征 关键特征的获取,可能需要对数据进行一定的清洗,探索分析及预处理数据抽取 - 数据探索分析 - 数据预处理,包括清洗和处理缺失值等 - 数据指标构建 - 模型构建及评价PS:由于数据隐私,本文着重讲 缺失值处理,模型构建和模原创 2017-09-28 17:31:47 · 2979 阅读 · 0 评论 -
利用时间序列预测用户系统是否过载
目标: 预测服务器磁盘已使用空间大小思路与流程: 系统长时间运行,数据会持续写入磁盘,存储空间持续减少。由此看来,磁盘空间大小与时间变化有很强的关联性,且历史数据对未来发展存在一定的影响,故采用时间序列模型 确定模型之后,需要抽取相应的数据。需要对数据进行周期性分析及数据清洗、数据变换等操作,以适应模型的的需要抽取数据 - 数据探索 - 数据预处理 - 构建模型一、抽取数据 本次挖掘抽取 2原创 2017-10-19 22:11:54 · 439 阅读 · 0 评论 -
利用聚类分析航空公司客户价值
目标: 客户分类,比较分析不同类别客户价值,制定相应的营销策略思路与流程: 分析的目标是将航空公司客户分类,属于无监督学习,故采用聚类挖掘模型 确定模型之后,需要选择相应的指标,这里指标的选择需结合业务来确定,能够反映客户的关键特征 确定模型和指标之后,可能需要对数据进行一定的探索分析,预处理等,以适应挖掘的需要数据抽取 - 数据探索分析 - 数据预处理 - 构建模型及模型应用一、数据抽取首原创 2017-10-11 14:40:25 · 4869 阅读 · 2 评论 -
利用关联规则挖掘中医证素与恶性肿瘤的关系
目标: 借助病理信息,挖掘各中医证素与乳腺癌TNM分期之间的关系思路与流程: 目的是为了挖掘各中医证素与乳腺癌TNM分期之间的关系,故采用关联规则模型 确定模型之后,需要整理患者的各中医证素与乳腺癌TNM分期数据。需要对数据进行预处理,包括数据清洗,属性规约,数据变换等,以适应挖掘的需要获取数据 - 数据预处理 - 构建模型一、获取数据中医证素:’肝气郁结证型系数’、’热毒蕴结证型系数’、’冲原创 2017-10-16 13:48:41 · 1739 阅读 · 1 评论 -
用户消费行为分析
数据:CDNow网站的用户购买明细 目的:根据CDNow网站的用户购买明细,分析用户的消费行为 分析思路: 原始数据并未提供分析目的要求的行为数据,需通过已知的数据构建指标。目的是为了分析用户的消费行为,故采用维度分析法,从特定的角度和层面分析数据 分析内容: 1. 销量和消费金额分析 2. 消费的时间节点 3. 复购率,回购率分析 4. 用户分层 5. 用户生命周期和消费周期先看原创 2017-09-13 17:47:51 · 13505 阅读 · 1 评论