自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 基于Python的淘宝用户行为数据分析

数据:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46来源于阿里天池,是阿里巴巴提供的移动端淘宝用户行为数据集,包含2014-11-18至2014-12-18共计一千两百多万条数据特征说明user_id用户名(脱敏)item_id商品名(脱敏)behavior_type行为(点击,收藏,加入购物车,购买)对应1,2,3,4user_geohash地理位置(大量缺失)item_categor

2020-07-16 15:28:25 8302 4

原创 Kaggle-电信客户流失分析及应对措施

Kaggle-电信客户流失分析及应对措施-随机森林分析原因分析目标分析背景数据集内容分析流程分析结果制定策略对流失用户进行召回总结分析原因在产品使用过程中,一些用户会因为各式各样的原因而不再使用我们的产品, 这些用户难道就任由他们流失了吗?分析目标正面,通过对流失客户的分析,我们产品质量和生命周期得到优化反面,分析所有相关的客户数据,并开发针对性的客户保留服务分析背景项目数据来源于Kaggle-电信客户流失数据集内容1. 上个月内离开的客户–该列称为“客户流失”2. 每个客户已签署的服务

2020-06-28 15:34:31 3940

原创 Kaggle-Titanic生存预测-数据分析-随机森林

Titanic生存预测-数据分析 数据分析学习之路1.当我们拿到一个数据,首先要对数据进行观察,可以用Excel等工具,这里我使用的是jupyter notebook首先对数据进行观察,并进行简单的预处理我们发现表中Age有177个缺失值,Cabin的缺失值更多我们将对Age进行平均值的填充,而Cabin不好进行填充,因为缺失条件太多2.在对数据进行填充完成过后,我们心中应该是对数据的特征以及特征值的类型

2020-06-14 18:32:26 967

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除