![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
动手学数据分析课程打卡
文章平均质量分 91
愉愉儿
这个作者很懒,什么都没留下…
展开
-
动手做数据分析第二章数据重构
第三节 数据重构 数据聚合与运算 1. 导入文件后计算泰坦尼克号男性与女性的平均票价。groupby函数可用来分组及分组后的数据运算,df[结果属性].groupby([df[分类属性1],df[属性2]…).mean()(函数名称) means = text['Fare'].groupby(text['Sex']).mean() 2.统计泰坦尼克号中男女的存活人数,可使用groupby函数 age_sum = text['Survived'].groupby(text['sex']..原创 2021-11-20 19:04:57 · 826 阅读 · 0 评论 -
动手学数据分析第二章第一节
第二章 第一节 数据清洗及特征处理 导入库,数据载入省略。。。。(上一章已学过) 2.1 缺失值观察 1. train. info()可以查看每个特征缺失值个数,如图所示; 也可用train['Age'].isnull().sum()直接得到该特征的缺失值个数 train. info() print(train['Age'].isnull().sum()) 2.查看Age, Ca...原创 2021-11-18 19:23:03 · 1130 阅读 · 0 评论 -
动手学数据分析第一章总结
第一章 数据载入及初步观察 第一节 数据的加载以及入门 1.1载入数据 os.getcwd()可查看文件的位置:C:\Users\..... 载入数据可用相对路径和绝对路径 数据载入使用pd.read_csv(‘路径’),因为这个是.csv文件 相对路径载入: 绝对路径载入: 可用encoding=’utf-8’避免乱码;斜杠的方式可用‘/’和‘\’,但使用‘\‘时需要用r。 每1000行为一个数据模块,逐块读取 使用pandas处理文件时,经常会遇到大文件,...原创 2021-11-16 20:15:24 · 1028 阅读 · 0 评论