![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
文章平均质量分 93
liying_tt
这个作者很懒,什么都没留下…
展开
-
Day12-Python综合练习2(DataWhale)
一、显卡日志下面给出了3090显卡的性能测评日志结果,每一条日志有如下结构:Benchmarking #2# #4# precision type #1# #1# model average #2# time : #3# ms其中#1#代表的是模型名称,#2#的值为train(ing)或inference,表示训练状态或推断状态,#3#表示耗时,#4#表示精度,其中包含了float, half, double三种类型Benchmarking 2(Inference) 4(float) prec原创 2021-01-13 22:00:32 · 523 阅读 · 0 评论 -
Day11-Python时序数据(DataWhale)
时序数据import numpy as npimport pandas as pd一、时序中的基本对象(1) 时间戳 (Date times): pandas 中称为 Timestamp,一系列的时间戳可以组成 DatetimeIndex ,将它放到 Series 中后, Series 的类型就变为了 datetime64[ns] ,如果有涉及时区则为 datetime64[ns, tz] ,其中tz是timezone的简写(2) 时间差(Time deltas): pandas中利用 Time原创 2021-01-10 22:48:21 · 832 阅读 · 0 评论 -
Day10-Python有序数据(DataWhale)
import pandas as pd import numpy as np分类数据一、cat对象1. cat对象的属性(1) pandas 中提供了 category 类型,能够处理分类类型的变量(2) astype将普通序列转换为分类变量df = pd.read_csv('data/learn_pandas.csv', usecols=['Grade','Name','Gender','Height','Weight'])s = df.Grade.ast原创 2021-01-07 16:56:09 · 641 阅读 · 0 评论 -
Day9-Python文本数据(DataWhale)
文本数据import pandas as pd import numpy as npprint(pd.__version__)1.2.0一、str对象1. str对象的设计意图(1) str 对象是定义在 Index 或 Series 上的属性,专门用于逐元素处理文本内容(2) 对一个序列进行文本处理,首先需要获取其 str 对象(3) 有 str 模块, 许多函数的用法与pandas一致var = 'abcd'str.upper(var) # Python内置str模块'AB原创 2021-01-06 15:02:02 · 337 阅读 · 0 评论 -
Day8-Python缺失值(DataWhale)
缺失数据import pandas as pd import numpy as np一、缺失信息的统计和删除1. 缺失信息的统计缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,结合 mean 可以计算出每列缺失值的比例,sum可以计算每列缺失值的总数:df = pd.read_csv('data/learn_pandas.csv', usecols=['Grade','Name','Gender','Height','原创 2021-01-03 22:33:01 · 508 阅读 · 0 评论 -
Day7-Python综合作业1(DataWhale)
import numpy as npimport pandas as pdimport math任务1:企业收入的多样性一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中 p(x)是企业该年某产业收入额占该年所有产业总收入的比重。在company.csv中存有需要计算的企业和年份,在company_data.csv中存有企业、各类收入额和收入年份的信息。现请利用后一张表中的数据,在前一张表中增加一列表示该公司该年份的收入熵指标I思路:1.将company_data表转换位原创 2021-01-01 22:48:41 · 642 阅读 · 0 评论 -
Day6-Python连接(DataWhale)
连接import numpy as npimport pandas as pd一、关系型连接1. 连接的概念on参数:连接的键值how参数:连接形式:merge、join(left、right、inner、outer)只要两边同时出现的值,就以笛卡尔积的方式加入,如果单边出现则根据连接形式进行处理2. 值连接1.上面是两张表根据某一列的值来连接,事实上还可以通过几列值的组合进行连接,这种基于值的连接在 pandas 中可以由 merge 函数实现df1 = pd.DataFrame原创 2020-12-29 21:13:51 · 272 阅读 · 0 评论 -
Day5-Python变形(DataWhale)
变形import numpy as npimport pandas as pd一、长表变宽表长表:一个表中把性别存储在某一个列中,它就是关于性别的长表宽表:把性别作为列名,列中的元素是某一其他的相关特征数值,这个表是关于性别的宽表#长表pd.DataFrame({'Gender':['F','F','M','M'], 'Heigth':[163,160,175,180]}) Gender Heigth原创 2020-12-27 20:52:57 · 643 阅读 · 0 评论 -
Day4-Python分组(DataWhale)
分组import numpy as npimport pandas as pd一、分组模式及其对象1. 分组的一般模式分组的三个要素:分组依据、数据来源、操作及其返回结果一般模式:df.group(分组依据)[数据来源].使用操作df = pd.read_csv('data/learn_pandas.csv')df.groupby('Gender')['Height'].mean()#按照性别统计身高的平均值GenderFemale 159.19697Male 1原创 2020-12-25 20:02:38 · 822 阅读 · 0 评论 -
Day3-Python索引(Datawhale)
一、索引器import numpy as npimport pandas as pd1.1 表的索引列索引,通过[列名]实现:返回值为Series[列名组成的列表]:返回值为DataFrame.列名:取出单列并且列名不包含空格,等价于[列名]df = pd.read_csv('data/learn_pandas.csv', usecols=['School','Grade','Name','Gender','Weight','Transfer'])df['N原创 2020-12-22 23:38:18 · 418 阅读 · 0 评论 -
Day2-Python-Pandas基础(Datawhale)
1. Pandas基础import numpy as npimport pandas as pdprint("pandas的版本是:",pd.__version__)pandas的版本是: 1.1.31.1 文件的读取和保存1.1.1 文件的读取1.1.1.1 读取csv文件pd.read_csv() 将数据放入目录下,会减少不必要的麻烦df_csv = pd.read_csv('data/my_csv.csv',header=None,usecols=[3,4])df_csv原创 2020-12-19 23:23:53 · 272 阅读 · 2 评论 -
Day1-Python-Numpy(Datawhale)
1. python基础1.1 列表推导式与条件赋值1.1.1 列表推导式L = [] #创建空列表def my_func(x): #定义函数my_func() return 2*xfor i in range(5): #for循环 L.append(my_func(i))print(L)[0, 2, 4, 6, 8]使用列表推导式[function for i in list] function:映射函数,list:迭代的对象[my_func(i) for i原创 2020-12-16 19:46:35 · 252 阅读 · 2 评论