Pandas
。
decade、
这个作者很懒,什么都没留下…
展开
-
【Task 6】连接
一、关系型连接1. 连接的基本概念连接的两个重要要素:键:用on参数表示,在关系型连接中,把两张相关的表按照某一个或某一组键连接起来是一种常见操作。 连接的形式:在pandas中的关系型连接函数merge和join中提供了how参数来代表连接形式,分为:左连接left 右连接right 内连接inner 外连接outer用示意图表示它们的区别:左连接:即以左边的键为准,如果右边表中的键于左边存在,那么就添加到左边,否则则处理为缺失值,右连接...原创 2020-12-28 19:58:31 · 209 阅读 · 0 评论 -
【Task 5】变形
一、长宽表的变形长表与宽表是针对于某一个特征而言的。一个表中把性别存储在某一个列中,这就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。# 长表 将 性别 和 身高 分别存储在某一列之中pd.DataFrame({'Gender':['F','F','M','M'], 'Height':[163, 160, 175, 180]}) ## 输出 Gender Height0 F 1原创 2020-12-27 20:41:51 · 315 阅读 · 0 评论 -
【Task 4】分组
一、分组模式及其对象1. 分组的一般模式实现分组操作,必须明确三个要素:分组依据 数据来源 操作及其返回结果同时从充分性的角度来说,明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:# 引用方法df.groupby(分组依据)[数据来源].使用操作以单一维度进行分组# 依据 性别 分组,统计全国人口 寿命 的 平均值df.groupby('Gender')['Longevity'].mean()# 在学生体测的数据集上,按照 性别 统计 ...原创 2020-12-25 22:51:34 · 157 阅读 · 0 评论 -
【Task 3】索引
一、索引器导入相关库:import numpy as npimport pandas as pd1. 表的列索引列索引是最常见的索引形式,一般通过[]来实现。如果取出一列,通过 [列名]可以从DataFrame中取出相应的列,返回值为Series。 如果要取出多个列,则可以通过[列名组成的列表],其返回值为一个DataFrame。df = pd.read_csv('data/learn_pandas.csv',usecols = ['School', ...原创 2020-12-22 20:44:36 · 118 阅读 · 0 评论 -
【Task 2】Pandas基础
一、文件的读取和写入1. 文件读取pandas可以读取的文件格式有很多,主要有csv,excel,txt文件。其中的公共参数为:header=None:表示第一行不作为列名 index_col:表示把某一列或几列作为索引 usecols:表示读取列的集合,默认读取所有的列 parse_dates:表示需要转化为时间的列 nrows:表示读取的数据行数这些参数在上述的三个读取文件的函数里都可以使用。pd.read_table('data/my_table.txt',...原创 2020-12-19 20:40:22 · 188 阅读 · 1 评论 -
【Task 1】 Python基础与Numpy基础
Task 1 思维导图一、python基础1、列表推导式和条件赋值列表推导式:在一定的Python语法基础上实现语句的简化操作,可以利用列表推导式进行写法上的简化:[*foriin*]。其中,第一个*为映射函数,其输入为后面i指代的内容,第二个*表示迭代的对象。def my_func(x): return x ^ 2# 结果如下[0, 1, 4, 9, 16]## 列表推导式[myfunc(i) for i in range(5)]# ...原创 2020-12-16 23:36:42 · 240 阅读 · 0 评论