DW_pandas学习记录
文章平均质量分 64
小五的眼里有星星
这个作者很懒,什么都没留下…
展开
-
pandas:综合练习
【任务四】显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型,下面是一个具体的例子:Benchmarking Inference fl原创 2021-01-13 23:39:44 · 178 阅读 · 0 评论 -
pandas task10:时序数据
第十章 时序数据好快,已经第十章了!一、时序中的基本对象2020年9月7日周一早上8点整需要到教室上课,这个课会在当天早上10点结束,简单的一件事包含了四个时间概念:第一,会出现时间戳(Date times)第二,会出现时间差(Time deltas)第三,会出现时间段(Time spans)第四,会出现日期偏置(Date offsets)前三个都很好理解,重点来看一下第四个概念:日期偏置假设只知道9月的第一个周一早上8点要去上课,但不知道具体的日期,例如想要知道2020年9月7日后的第3原创 2021-01-10 23:40:25 · 106 阅读 · 0 评论 -
pandas task9:分类数据
一、cat对象cat对象的属性在pandas中提供了category类型,使用户能够处理分类类型的变量,将一个普通序列转换成分类变量可以使用astype方法。astype来进行转换。df = pd.read_csv('../data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight'])s = df.Grade.astype('category')s.head()output:在一个分原创 2021-01-07 23:53:26 · 98 阅读 · 0 评论 -
pandas task8:文本数据
一、str对象1. str对象的设计意图str对象是定义在Index或Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其str对象。在Python标准库中也有str模块,为了使用上的便利,有许多函数的用法pandas照搬了它的设计,例如字母转为大写的操作:var = 'abcd'str.upper(var) # Python内置str模块2. []索引器对于str对象而言,可理解为其对字符串进行了序列化的操作,例如在一般的字符串中原创 2021-01-06 23:47:09 · 90 阅读 · 0 评论 -
pandas task7
第七章 缺失数据一、缺失值的统计和删除1. 缺失信息的统计df = pd.read_csv('../data/learn_pandas.csv', usecols = ['Grade', 'Name', 'Gender', 'Height', 'Weight', 'Transfer'])df.isna().head()取出需要的几列,output:查看比例有时更有用,而不是单单地只看哪些数值是缺失值!!!缺失数据可以使用isna或isnull(两个函数没有区别)来查看每个单元格是否缺失,结原创 2021-01-03 23:28:49 · 131 阅读 · 0 评论 -
task special & task 11
能力较差,不太会做。此次作业完成比较困难,有借鉴别人(Gocara)的代码~【任务一】企业收入的多样性调包import pandas as pdimport numpy as npnp.seterr(all = 'ignore')读取两个表格里的数据df1 = pd.read_csv('company.csv')df2 = pd.read_csv('company_data.csv')df1.head()df2.head()由上面两个结果可知,两个表格中的数据格式不一致,所以原创 2021-01-01 23:57:10 · 119 阅读 · 0 评论 -
pandas task6
第六章 连接一、关系型连接1.连接的基本概念左连接,右连接,内连接,外连接。左连接就是以左边表里的键为准,如果右边表里出现左表利的键,就添加到左表里,否则就不添加。内连接:只合并两个表里同时出现的键。!如果 出现重复的键怎么处理?原则:只要两边同时出现的键,就以笛卡尔积的方式加入,如果单边出现则根据连接的形式加入。小结:left:参与合并的左侧DataFrameright:参与合并的右侧DataFramehow:inner、outer、left、right其中之一2. 值连接两张表原创 2020-12-29 23:44:42 · 161 阅读 · 0 评论 -
pandas Task5
一、长宽表的变形长表和宽表的概念一下子就有点晕,我试着自己理解一遍。“一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。”关于“性别”的长表:就是想要储存和展现性别这一特征。(性别是主体)关于“性别”的宽表:性别只是其他某一特征进行分类的一个标准,还是想要储存和展现其他的这个特征。(性别不是主体,其他的这一个特征才是主体)例子:pd.DataFrame({'Gender':['F','F','M','M'原创 2020-12-27 23:42:09 · 97 阅读 · 0 评论 -
pandas task4
一、分组模式及其对象分组的一般模式要实现分组操作,必须明确三个要素: 分组依据 、 数据来源 、 操作及其返回结果 。同时从充分性的角度来说,如果明确了这三方面,就能确定一个分组操作,从而分组代码的一般模式即:df.groupby(分组依据)[数据来源].使用操作例如:要实现依据“性别”分组,统计全国人口 “寿命”的“平均值”代码为df.groupby('Gender')['Longevity'].mean()想要按照性别统计身高中位数,代码如下:df = pd.read_csv('.原创 2020-12-25 22:03:31 · 136 阅读 · 0 评论 -
pandas task3索引
task3 索引一、索引器1.表的列索引取出多个列,则可以通过[列名组成的列表],其返回值为一个DataFram。注意这里要把列名放进列表里!df[['Gender', 'Name']].head()若要取出单列,且列名中不包含空格,则可以用.列名取出,这和[列名]是等价的。df.Name.head()这两个操作都很常见。2.序列的行索引【a】以字符串为索引的Seriess = pd.Series([1, 2, 3, 4, 5, 6], index=['a', 'b', 'a',原创 2020-12-22 23:39:59 · 84 阅读 · 0 评论 -
pandas学习:task2
一.文件的读取和写入1.普通读取pd.read_csv, pd.read_table, pd.read_excel, 分别用来读取csv、txt、excel文件- 常用的公共参数header=None:第一行不作为列名index_col:把某一列或几列作为索引usecols:读取列的集合,默认读取所有的列parse_dates:需要转化为时间的列nrows:读取的数据行数。2.详细解释- header= None:read_csv读取时会自动识别表头,数据有表头时不能设置header为原创 2020-12-19 19:01:16 · 408 阅读 · 3 评论 -
pandas学习:task1
Task 1 预备知识Python基础1.1列表的输出一般写法原创 2020-12-16 20:26:23 · 127 阅读 · 1 评论