![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 96
Alex好好干饭
这个作者很懒,什么都没留下…
展开
-
pandas-task11-综合练习.md
文章目录显卡日志解决思路水压站点的特征工程显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchma原创 2021-01-12 15:18:04 · 555 阅读 · 0 评论 -
pandas-task10-时序数据.md
文章目录一、时序中的基本对象二、时间戳三、时间差四、日期偏置五、时序中的滑窗与分组六、练习Ex1:太阳辐射数据集Ex2:水果销量数据集本周末期末考试 三门 需要复习 只能大概快速梳理一下了 写了下练习题 写的不全请见谅 之后会补上一、时序中的基本对象二、时间戳三、时间差四、日期偏置五、时序中的滑窗与分组六、练习Ex1:太阳辐射数据集现有一份关于太阳辐射的数据集:将 Datetime, Time 合并为一个时间列 Datetime ,同时把它作为索引后排序。先看下表格什么样子:d原创 2021-01-08 15:57:52 · 365 阅读 · 1 评论 -
pandas_task01-预备知识.md
第一章 预备知识python基础1. 列表推导式与条件赋值列表表达式#第个*是映射函数,第二个*是指代的对象 [* for i in *]列表表达式还支持多层嵌套 [m+'_'+n for m in ['a', 'b'] for n in ['c', 'd']]个人理解:虽然简单了,字数变少了,但是是可读性降低了,对程序员没那么友好。简单的一步操作可以,多层嵌套或者复杂逻辑不太建议过多使用该方式。条件赋值value = a if condition else b :2.匿名函数和原创 2020-12-16 21:19:07 · 193 阅读 · 0 评论 -
pandas-task09-分类数据.md
文章目录一、cat(category)对象1. cat对象的属性2. 类别的增加、删除和修改1. 增加 add_categories2.删除 remove_categories3.改 rename_categories二、有序分类1. 序的建立2. 排序和比较三、区间类别1. 利用cut和qcut进行区间构造2. 一般区间的构造3. 区间的属性与方法四、练习Ex1:统计未出现的类别Ex2:钻石数据集一、cat(category)对象1. cat对象的属性pandas中有一个dtype为category原创 2021-01-07 21:29:15 · 219 阅读 · 0 评论 -
pandas-task08-文本数据.md
文章目录一、str对象1. str对象的设计意图2. []索引器3. string类型二、正则表达式基础1. 一般字符的匹配2. 元字符基础3. 简写字符集三、文本处理的五类操作1. 拆分2. 合并3. 匹配4. 替换5. 提取四、常用字符串函数1. 字母型函数2. 数值型函数3. 统计型函数4. 格式型函数五、练习Ex1:房屋信息数据集![在这里插入图片描述](https://img-blog.csdnimg.cn/2021010622052797.png?x-oss-process=image/wate原创 2021-01-06 22:11:40 · 352 阅读 · 3 评论 -
pandas-task07-缺失数据.md
文章目录缺失数据一、缺失值的统计和删除1. 缺失信息的统计2. 缺失信息的删除二、缺失值的填充和插值1. 利用fillna进行填充2. 插值函数三、Nullable类型1. 缺失记号及其缺陷2. Nullable类型的性质3. 缺失数据的计算和分组四、练习(待完成)Ex1:缺失值与类别的相关性检验Ex2:用回归模型解决分类问题缺失数据在数据处理过程种我们经常会遇到缺失数据如NaN或None这样的值,我们一般会对这些数据单独处理,删除或者修改或者忽略等,下面分不同情况讨论下如何处理缺失数据。下面操作以此原创 2021-01-02 23:45:08 · 1413 阅读 · 3 评论 -
pandas-task-special.md
【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份,在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据,在前一张表中增加一列表示该公司该年份的收入熵指标 I。df1 = pd.read_csv('./data/task_special/company.csv')df2 = pd.read原创 2021-01-01 23:20:42 · 180 阅读 · 2 评论 -
pandas-task06-连接.md
文章目录一、关系型连接1. 连接的基本概念2. 值连接 merge练一练3. 索引连接二、方向连接1. concat2. 序列Series与表DataFrame的合并三、类连接操作1. 比较2. 组合四、练习Ex1:美国疫情数据集Ex2:实现join函数一、关系型连接1. 连接的基本概念对DataFrame或命名的Series对象,按照键连接,和数据库的连接基本一致一样,同样也有左连和右连。重复数据按照笛卡尔积进行连接。2. 值连接 merge上面说的按照键连接也是一种值连接,除了按照一列值进行连原创 2020-12-29 23:14:53 · 203 阅读 · 2 评论 -
pandas-task05.md
文章目录变型一、长宽表的变形1. pivot-长变宽2. pivot_table3. melt-宽变长4. wide_to_long二、索引的变形1. stack与unstack2. 聚合与变形的关系三、其他变形函数1. crosstab2. explode3. get_dummies四、练习Ex1:美国非法药物数据集Ex2:特殊的wide_to_long方法变型为什么要变型?在不同的场景下我们可能需要不同形式的数据,以便更好地展示。如练习1中的数据除了年份其余大部分数据都是相似的,将不同的年份细分可原创 2020-12-27 00:29:25 · 1142 阅读 · 0 评论 -
pandas-task04.md
文章目录第四章 分组一、分组模式及其对象1. 分组的一般模式2.分组的本质-按条件列表中元素的值的组合来分组(数据来源组合的unique值)多属性分组复杂逻辑分组练一练3.Groupby对象二、聚合函数1. 内置聚合函数2.agg方法三、变换和过滤1. 变换函数与transform方法2. 组索引与过滤四、跨列分组五、练习Ex1:汽车数据集第四章 分组一、分组模式及其对象1. 分组的一般模式分组依据 、 数据来源(要操作的数据,如身高、体重、分数) 、 操作及其返回结果df.groupby(分组依原创 2020-12-25 22:34:44 · 242 阅读 · 0 评论 -
pandas-task03.md
索引一、索引器1. 表的列索引一般通过[ ]来索引,如单列df[‘Student’],多列[]要传入列表如df[[‘School’,‘Grade’]].head()单列也可以df.Student取出2. 序列的行索引【a】以字符串为索引的 Series原创 2020-12-22 22:49:35 · 220 阅读 · 0 评论 -
pandas-task02.md
Mon 06Mon 13Mon 20Completed task Active task Future task Future task2 Completed task in the critical line Implement parser and jison Create tests for parser Future task in critical li原创 2020-12-19 23:25:58 · 250 阅读 · 3 评论