Pandas
文章平均质量分 92
OohMuYi
总要为一件事全力以赴过
展开
-
Pandas10--时序数据
目录1 时序中的基本对象2 时间戳2.1 Timestamp的构造与属性2.2 Datetime序列的生成2.3 dt对象1 时序中的基本对象2 时间戳2.1 Timestamp的构造与属性2.2 Datetime序列的生成2.3 dt对象原创 2021-01-10 21:42:58 · 205 阅读 · 0 评论 -
Pandas09--分类数据
目录1 cat对象1.1 cat对象的属性1.2 2. 类别的增加、删除和修改2 有序分类2.1 序的建立2.2 排序和比较3 区间类别3.1 利用cut和qcut进行区间构造3.2 一般区间的构造3.3 区间的属性与方法4 练习1 cat对象1.1 cat对象的属性1.2 2. 类别的增加、删除和修改2 有序分类2.1 序的建立2.2 排序和比较3 区间类别3.1 利用cut和qcut进行区间构造3.2 一般区间的构造3.3 区间的属性与方法4 练习...原创 2021-01-07 18:22:14 · 121 阅读 · 0 评论 -
Pandas08--文本数据
目录1 str对象1.1 str基础1.2 string类型2 正则表达式基础3 文本处理的五类操作3.1 拆分3.2 合并3.3 匹配3.4 替换3.5 提取4 常用字符串函数5 练习5.1 房屋信息数据集5.2 《权力的游戏》剧本数据集1 str对象1.1 str基础str对象的设计意图作用:str对象是定义在 Index 或 Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法。使用:对一个序列进行文本处理,首先需要获取其str对象。注意:在Python标准库中原创 2021-01-06 15:25:32 · 405 阅读 · 0 评论 -
Pandas07--缺失数据
目录1 缺失值的统计和删除1.1 缺失信息的统计1.2 缺失信息的删除2 缺失值的填充和插值2.1 利用fillna进行填充2.2 插值函数3 Nullable类型3.1 缺失记号及其缺陷3.2 Nullable类型的性质3.3 缺失数据的计算和分组4 练习1 缺失值与类别的相关性检验4.2 用回归模型解决分类问题1 缺失值的统计和删除1.1 缺失信息的统计isna或isnull函数:缺失数据可以使用isna 或isnull (两个函数没有区别)来查看每个单元格是否缺失,结合 mean可以计算出每原创 2021-01-02 22:32:02 · 230 阅读 · 0 评论 -
Pandas(Special)--综合练习
目录1 企业收入的多样性参考1.[参考2](https://www.jianshu.com/p/1208016803f2).2 组队学习信息表的变换3 美国大选投票情况1 企业收入的多样性>>>df1 = pd.read_csv('company.csv')>>>df2 = pd.read_csv('company_data.csv')>>>df1.head() 证券代码 日期0 #000007 20141 #000403 2015原创 2021-01-01 20:58:13 · 227 阅读 · 0 评论 -
Pandas06--连接
目录1 关系型连接1.1 连接的基本概念1.2 值连接1.3 索引连接2 方向连接2.1 concat2.2 序列与表的合并3 类连接操作3.1 比较3.2 组合1 关系型连接1.1 连接的基本概念键:在关系型连接中, 键 是十分重要的,往往用on参数表示连接形式:在pandas中的关系型连接函数merge 和 join中提供了how 参数来代表连接形式,分为左连接 left 、右连接 right 、内连接 inner 、外连接 outer不同连接形式的区别:分析:从图中可以看到,所谓原创 2020-12-29 17:33:46 · 169 阅读 · 0 评论 -
Pandas05--变形
目录1 长宽表的变形1.1 pivot1.2 pivot_table1.3 melt1.4 wide_to_long2 索引的变形2.1 stack与unstack2.2 聚合与变形的关系3 其他变形函数4 习题1 长宽表的变形长表和宽表:这个概念是对于某一个特征而言的。比如,一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。# 关于性别的长表pd.DataFrame({'Gender':['F','F',原创 2020-12-27 17:59:25 · 481 阅读 · 0 评论 -
Pandas04--分组
目录1 分组1.1 基本概念1.2 Groupby对象1.3 分组的三大操作2 聚合函数2.1 内置聚合函数2.2 agg方法1 分组1.1 基本概念分组的三大要素:分组依据、数据来源、操作及其返回结果。(依据等级分组,统计高一年级的语文成绩的平均值)语法:.groupby(分组依据)[数据来源].使用操作[数据来源]:不仅是单一维度,也可以是多个维度,只要是相应列名构成的列表即可。也可以是复杂的逻辑运算结果【例子1】多个维度df = pd.read_csv('data/learn原创 2020-12-25 18:00:39 · 232 阅读 · 0 评论 -
Pandas03--索引
目录1 索引器1.1 表的列索引1.2 序列的行索引1.3 loc索引器1.4 iloc索引器1.5 query方法1.6 随机抽样2 多级索引2.1 多级索引及其表的结构2.2 多级索引中loc索引器2.3 IndexSlice对象2.4 多级索引的构造3 索引的常用方法3.1 索引层的交换和删除3.2 索引属性的修改3.3 索引的设置与重置3.4 索引的变形4 索引运算4.1 集合的运算法则4.2 一般的索引运算5 练习6 总结1 索引器1.1 表的列索引基础用法:通过[ ]实现,通过[列名]原创 2020-12-22 18:48:40 · 352 阅读 · 1 评论 -
Pandas02--pandas基础
目录1 文件的创建在这里插入图片描述2 文件读取3 基本数据结构3 常用基本函数4 窗口对象5 练习1 文件的创建可创建的文件类型”数据类型新建方法说明sv、tsv、txtpd.to_csv用逗号、tab分割的纯文本文件excelpd.to_excelxls或xlsxqlpd.to_sql关系数据库表【例子1】新建文件并导入数据import pandas as pdpath = 'd:/新建文件.xlsx' # 文件创建的路径# 文件原创 2020-12-19 23:28:10 · 276 阅读 · 2 评论 -
Pandas01-预备知识(Python、Numpy)
目录1 Python基础1.1 列表推导式1 Python基础1.1 列表推导式原创 2020-12-16 23:33:29 · 239 阅读 · 2 评论