自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 组队学习-free_excel-知识点和作业汇总

Excel提供从文件导入到工作簿当中,支持.txt或csv文件,操作路径为菜单栏选择:数据-获取和转换数据-从文件/CSV。更改csv文件的数据后在点击路径:设计-外部表数据-刷新后就可以更新工作表数据。task01练习:1、单元格数据类型1.1数字下图展示的是真假数值列,真数值默认情况下是右对齐(方便观测数据位数),假数值是数值型文本属于文本,左上角会有个绿色三角错误检查,当数据是文本时,无法完成数字运算操作。Excel会自带数据纠错功能,点击黄色感叹号可以看到,将文本转出数字,或者使用函数将文本转成数字

2022-10-09 21:53:36 265 1

原创 组队学习-动手学数据分析-第二章第2、3节

写入代码 df [ 'Age2' ] = pd . cut(df [ 'Age' ] , [ 0 , 5 , 15 , 30 , 50 , 80 ]) chrs = df . groupby('Age2') [ 'Survived' ] . sum() chrsAge2(0, 5] 44(5, 15] 39# 写入代码 chrs . idxmax()

2022-09-17 17:11:56 116

原创 组队学习-动手学数据分析-第二章第1节

【回顾&引言】前面一章的内容大家可以感觉到我们主要是对基础知识做一个梳理,让大家了解数据分析的一些操作,主要做了数据的各个角度的观察。那么在这里,我们主要是做数据分析的流程性学习,主要是包括了数据清洗以及数据的特征处理,数据重构以及数据可视化。这些内容是为数据分析最后的建模和模型评价做一个铺垫。

2022-09-13 20:23:14 112

原创 组队学习-动手学数据分析-第一章1,2,3节

这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上,实战数据分析全流程。这里有两份资料:教材《Python for Data Analysis》和 baidu.com &google.com(善用搜索引擎)

2022-09-12 14:38:00 153

原创 组队学习-pandas数据处理与分析-第4章

将三片海域各自划分为(10\times 10)大小相同的网格,逐月统计每个网格内的观测总次数,并将结果保存为3个(10\times 10\times 20\times 12)的数组,这些维度分别代表经度方向的网格划分、维度方向的网格划分、年数以及月数。在learn_pandas数据集中,Transfer列的元素为“N”时表示该名同学不是转系生,请按照学校和年级两列分组,找出所有不含转系生的组对应的学校和年级。对HP进行组内的min-max归一化,即每个元素减去组内HP的最小值后,再除以组内HP的极差。...

2022-09-01 11:43:08 1286

原创 组队学习-pandas数据处理与分析-第3章

当两个“*”指代的行元素和列元素在DataFrame的行索引和列索引中都为重复值,此时结果是什么类型?完成以下索引的相关操作:选出A学校和B学校的大一女生。select_dtypes()是一个实用函数,它能够从表中选出或剔除相应类型的列。若要选出所有数值型的列,只需使用.select_dtypes(include='number');若要剔除所有布尔类型和int64类型的列,只需使用.select_dtypes(exclude=['bool', 'int64'])。...

2022-08-29 16:35:29 409

原创 组队学习-pandas数据处理与分析-第2章

练一练请将上面代码中的index=False删除或设定index=True,对比结果有何差异。在上面的df中,如果data字典中'col_0'键对应的不是列表,而是1个索引与df中索引相同的Series,此时会发生什么?如果它的索引和df的索引不一致,又会发生什么?df['col_0']和df[['col_0']]二者得到的结果类型有什么区别?给定一个DataFrame,请构造其转置且不得使用“.T”。

2022-08-23 11:23:53 484

原创 组队学习-pandas数据处理与分析-第1章

生成器表达式可以省点内存,例如:直接sum(i for i in list),不要外面加 []ex1-1给定一个包含5个英语单词的列表,请构造1个字典以列表的元素为键,以每个键对应的单词字母个数为值。ex1-2给定3个二维整数列表\(L_1\), \(L_2\), \(L_3\),它们的形状都是\(30\times20\),即每个列表中包含30个内层列表,并且每一个内层列表中包含20个整数。...

2022-08-17 16:53:01 485

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除