![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 60
卡鲁鼙欧!
这个作者很懒,什么都没留下…
展开
-
ask Special & Task 11 综合练习(2020.12)
显卡日志【数据下载】链接:链接: https://pan.baidu.com/s/1CjfdtavEywHtZeWSmCGv3A.密码::4mui下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1##1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度原创 2021-01-13 22:28:32 · 294 阅读 · 0 评论 -
Pandas 10 序数据
一、时序中的基本对象在pandas中称为Timestamp。同时,一系列的时间戳可以组成DatetimeIndex,而将它放到Series中后,Series的类型就变为了datetime64[ns],如果有涉及时区则为datetime64[ns, tz]二、时间戳Timestamp的构造与属性单个时间戳的生成利用pd.Timestamp实现,一般而言的常见日期格式都能被成功地转换:Datetime序列的生成一组时间戳可以组成时间序列,可以用to_datetime和date_range来生原创 2021-01-10 21:48:11 · 178 阅读 · 1 评论 -
第九章 分类数据
第九章 分类数据一 所需要知识点crosstab 第一个参数是列,第二个参数是行;pd.corsstab(df.A, df.B)结构语法如下:pd.crosstab(index, columns, values=None,rownames=None, colnames=None, aggfunc=None, margins=False,margins_name: str = ‘All’, dropna: bool = True,normalize=False)2原创 2021-01-07 21:50:30 · 331 阅读 · 0 评论 -
Pandas 文本数据
Ex1:房屋信息数据集现有一份房屋信息数据集如下:将year列改为整数年份存储。将floor列替换为Level, Highest两列,其中的元素分别为string类型的层类别(高层、中层、低层)与整数类型的最高层数计算房屋每平米的均价avg_price,以***元/平米的格式存储到表中,其中***为整数。小结:str对象的设计意图str对象是定义在Index或Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其str对象原创 2021-01-06 19:55:39 · 107 阅读 · 0 评论 -
Pandas缺失数据
**一、缺失值的统计和删除缺失信息的统计**数据处理中经常需要根据缺失值的大小、比例或其他特征来进行行样本或列特征的删除,pandas中提供了dropna函数来进行操作。dropna的主要参数为轴方向axis(默认为0,即删除行)、删除方式how、删除的非缺失值个数阈值thresh( 非 缺 失 值 \color{red}{非缺失值} 非缺失值没有达到这个数量的相应维度会被删除)、备选的删除子集subset,其中how主要有any和all两种参数可以选择。例如,删除身高体重至少有一个缺失的行:原创 2021-01-03 19:42:17 · 124 阅读 · 0 评论 -
pandas综合练习
【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标 :其中 p(xi)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份 , 在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据 , 在前一张表中增加一列表示该公司该年份的收入熵指标I。【任务二】组队学习信息表的变换【题目描述】请把组队学习的队伍信息表变换为如下形态,其中’是否队长’一列取1表示队长原创 2021-01-01 22:49:51 · 260 阅读 · 1 评论 -
Pandas连接
美国疫情数据集现有美国4月12日至11月16日的疫情报表,请将New York的Confirmed, Deaths, Recovered, Active合并为一张表,索引为按如下方法生成的日期字符串序列:找到4月12日的报表数据:设置索引调出4月12日的的New York的Confirmed, Deaths, Recovered, Active以日期为主的字符串索引列表Ex2:实现join函数请实现带有how参数的join函数假设连接的两表无公共列调用方式为 join(df1, d原创 2020-12-29 19:42:26 · 3006 阅读 · 0 评论 -
Pandas的分组练习
练习一,汽车数据集现有一份汽车数据集,其中Brand, Disp., HP分别代表汽车品牌、发动机蓄量、发动机输出。1.先过滤出所属Country数超过2个的汽车,即若该汽车的Country在总体数据集中出现次数不超过2则剔除,再按Country分组计算价格均值、价格变异系数、该Country的汽车数量,其中变异系数的计算方法是标准差除以均值,并在结果中把变异系数重命名为CoV:中途换用Jupyternotebook,比pytorch简洁,易直观。2.按照表中位置的前三分之一、中间三分之一和后三原创 2020-12-25 18:26:05 · 777 阅读 · 0 评论 -
Pandas索引
Pandas索引的基础知识自我补充可变序列与不可变序列:复制列表和指向索引器一.列索引注:其中 x为多种类型的不同代称,我在手机端编辑,这边没有数据集为了方便统一写成了 x列索引是最常见的索引方式,一般通过 [ ]来实现,通过 [列名] 可以从DataFrame中取出相应的列,返回值为Seriesdf.= pd.read_csv(“data数据存储在你电脑的位置”, usecols = [“School”,”Grade”,”Name”,”Gende”,”weight”,”Transter原创 2020-12-22 20:35:31 · 440 阅读 · 0 评论