![](https://img-blog.csdnimg.cn/20190927151026427.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
python数据清洗及可视化
文章平均质量分 76
以Kaggle项目实践为主
一个游在的小鱼
这个作者很懒,什么都没留下…
展开
-
英国某电商在线零售客户细分_Kaggle项目
这是一个跨国数据集,其中包含在 2010 年 1 月 12 日到 2011 年 9 月 12 日之间发生的英国某电商在线零售的交易数据。数据量很庞大,在分析思路上可以使用机器学习K-Means 等算法,根据客户在市场上的购买行为来细分客户。...原创 2022-07-30 11:42:54 · 1384 阅读 · 2 评论 -
pip安装第三方库网速慢的解决方案
Python之所以好用,并受到大家的喜爱,我想很多优质的第三方库是其中一个原因。例如爬虫我们使用的requests库,数据分析中的pandas库,机器学习中的sklearn库等。原创 2022-07-30 11:26:04 · 1095 阅读 · 0 评论 -
从零开始数据分析Kaggle项目——小结(七)
数据重构部分,对前两节内容做个小结原创 2021-12-18 18:34:36 · 637 阅读 · 0 评论 -
从零开始数据分析Kaggle项目—泰坦尼克号(六)
主要内容包括数据的连接方式concat/merage/join/append,转置函数un/stack,groupby分组以及存活率计算。从数据的结果来看,女性存活率要高于男性,可能是“女士优先”绅士风度的体现吧,根据不同的舱级来看,票价更贵的存活率更高,一分钱一分货,生命不是平等的,生存几率也不是平等的原创 2021-12-18 01:38:56 · 232 阅读 · 0 评论 -
从零开始数据分析Kaggle项目——泰坦尼克号(五)
本章共四节,本章第2.1节主要内容,包括数据的清洗及特征处理,缺失值和重复值的处理,连续数据的离散化,转换类别文本,正则表达式。原创 2021-12-17 20:19:48 · 436 阅读 · 0 评论 -
从零开始数据分析Kaggle项目——小结(四)
基本小结原创 2021-12-15 18:06:09 · 1970 阅读 · 0 评论 -
从零开始数据分析Kaggle项目—泰坦尼克号(三)
主要内容如何利用Pandas进行排序、算术计算以及计算描述函数describe()的使用原创 2021-12-15 16:50:01 · 1442 阅读 · 0 评论 -
从零开始数据分析Kaggle项目—泰坦尼克号(二)
从零开始数据分析Kaggle项目—泰坦尼克号1—1.2原创 2021-12-15 16:14:08 · 936 阅读 · 0 评论 -
从零开始数据分析Kaggle项目—泰坦尼克号(一)
从零开始数据分析Kaggle项目—泰坦尼克号(一)原创 2021-12-12 12:43:40 · 819 阅读 · 0 评论