自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 英国某电商在线零售客户细分_Kaggle项目

这是一个跨国数据集,其中包含在 2010 年 1 月 12 日到 2011 年 9 月 12 日之间发生的英国某电商在线零售的交易数据。数据量很庞大,在分析思路上可以使用机器学习K-Means 等算法,根据客户在市场上的购买行为来细分客户。...

2022-07-30 11:42:54 1300 2

原创 pip安装第三方库网速慢的解决方案

Python之所以好用,并受到大家的喜爱,我想很多优质的第三方库是其中一个原因。例如爬虫我们使用的requests库,数据分析中的pandas库,机器学习中的sklearn库等。

2022-07-30 11:26:04 1073

原创 从零开始数据分析Kaggle项目——小结(七)

数据重构部分,对前两节内容做个小结

2021-12-18 18:34:36 612

原创 从零开始数据分析Kaggle项目—泰坦尼克号(六)

主要内容包括数据的连接方式concat/merage/join/append,转置函数un/stack,groupby分组以及存活率计算。从数据的结果来看,女性存活率要高于男性,可能是“女士优先”绅士风度的体现吧,根据不同的舱级来看,票价更贵的存活率更高,一分钱一分货,生命不是平等的,生存几率也不是平等的

2021-12-18 01:38:56 227

原创 从零开始数据分析Kaggle项目——泰坦尼克号(五)

本章共四节,本章第2.1节主要内容,包括数据的清洗及特征处理,缺失值和重复值的处理,连续数据的离散化,转换类别文本,正则表达式。

2021-12-17 20:19:48 428

原创 从零开始数据分析Kaggle项目——小结(四)

基本小结

2021-12-15 18:06:09 1966

原创 从零开始数据分析Kaggle项目—泰坦尼克号(三)

主要内容如何利用Pandas进行排序、算术计算以及计算描述函数describe()的使用

2021-12-15 16:50:01 1438

原创 从零开始数据分析Kaggle项目—泰坦尼克号(二)

从零开始数据分析Kaggle项目—泰坦尼克号1—1.2

2021-12-15 16:14:08 930

原创 从零开始数据分析Kaggle项目—泰坦尼克号(一)

从零开始数据分析Kaggle项目—泰坦尼克号(一)

2021-12-12 12:43:40 807

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除