pandas学习笔记
文章平均质量分 93
埋在地里的小土豆
这个作者很懒,什么都没留下…
展开
-
pandas学习task11综合任务
这是在datawhale学习小组学习pandas的最后综合练习,以下是学习笔记,仅供参考,不喜勿喷,笔者比较菜还在肝第二题,先把题目放出来,大家一块学习。DataWhaleTask Special & Task 11 综合练习import pandas as pdimport numpy as np任务一企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标:其中[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9p44b原创 2021-01-13 23:56:28 · 300 阅读 · 0 评论 -
pandas学习task10时序数据
这是在datawhale学习小组学习pandas的第十章内容,时序数据,以下是学习笔记,仅供参考,不喜勿喷DataWhale第十章 时序数据import numpy as npimport pandas as pd一、时序中的基本对象时间序列的概念在日常生活中十分常见,但对于一个具体的时序事件而言,可以从多个时间对象的角度来描述。例如2020年9月7日周一早上8点整需要到教室上课,这个课会在当天早上10点结束,其中包含了哪些时间概念?第一,会出现时间戳(Date times)的概念,即’20原创 2021-01-10 23:37:08 · 207 阅读 · 0 评论 -
Pandas学习task09分类数据
这是在datawhale学习小组学习pandas的第九章内容,分类数据,以下是学习笔记,仅供参考,不喜勿喷DataWhale第九章 分类数据import numpy as npimport pandas as pd一、cat对象1. cat对象的属性在 pandas 中提供了 category 类型,使用户能够处理分类类型的变量,将一个普通序列转换成分类变量可以使用 astype 方法。df = pd.read_csv(r'C:\Users\zhoukaiwei\Desktop\joyfu原创 2021-01-07 23:39:44 · 148 阅读 · 0 评论 -
pandas 学习task08文本数据
这是在datawhale学习小组学习pandas的第八章内容,文本数据,以下是学习笔记,仅供参考,不喜勿喷DataWhale第八章 文本数据import numpy as np import pandas as pd一、str对象1. str对象的设计意图str 对象是定义在 Index 或 Series 上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其 str 对象。在Python标准库中也有 str 模块,为了使用上的便利,有许多函数原创 2021-01-06 23:23:31 · 118 阅读 · 0 评论 -
pandas学习task07缺失数据
这是在datawhale学习小组学习pandas的第七章内容,缺失数据,以下是学习笔记,仅供参考,不喜勿喷DataWhale第七章 缺失数据import numpy as npimport pandas as pd一、缺失值的统计和删除1. 缺失信息的统计缺失数据可以使用 isna 或 isnull (两个函数没有区别)来查看每个单元格是否缺失,结合 mean 可以计算出每列缺失值的比例:df = pd.read_csv(r'C:\Users\zhoukaiwei\Desktop\joyf原创 2021-01-03 23:06:43 · 147 阅读 · 0 评论 -
Pandas学习任务1-3
这是在DataWhale学习小组pandas学习中的一个任务,由于作者太菜了,连第一题还在思考中,先把题目放出来吧,大家一块讨论,有思路的可以直接给作者留言,不胜感激。DataWhale【任务一】企业收入的多样性【题目描述】一个企业的产业收入多样性可以仿照信息熵的概念来定义收入熵指标: I = − ∑ i p ( x i ) log ( p ( x i原创 2021-01-01 23:49:20 · 193 阅读 · 0 评论 -
pandas学习task06连接
这是在datawhale学习小组学习pandas的第六章内容,连接,以下是学习笔记,仅供参考,不喜勿喷DataWhale参考:https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch6.html第六章 连接import numpy as npimport pandas as pd一、关系型连接值连接#通过值连接来实现左连接df1 = pd.DataFrame({'df1_name':['原创 2020-12-29 23:23:37 · 131 阅读 · 2 评论 -
pandas学习task05变形
这是在datawhale学习小组学习pandas的第五章内容,变形,以下是学习笔记,仅供参考,不喜勿喷DataWhale参考:https://datawhalechina.github.io/joyful-pandas/build/html/%E7%9B%AE%E5%BD%95/ch5.html第五章 变形import numpy as npimport pandas as pd一、长宽表的变形一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他原创 2020-12-27 22:01:59 · 364 阅读 · 0 评论 -
pandas 学习task04分组
这是在datawhale学习小组学习pandas的第四章内容,分组,以下是学习笔记,仅供参考,不喜勿喷DataWhale第四章 分组一、分组模式及其对象1. 分组的一般模式df.groupby(分组依据)[数据来源].使用操作 #分组的常用形式学生体测的数据集上,如果想要按照性别统计身高中位数import numpy as npimport pandas as pddf = pd.read_csv(r'C:\Users\zhoukaiwei\Desktop\joyful-pandas\da原创 2020-12-25 21:26:44 · 246 阅读 · 0 评论 -
pandas学习task03索引
一、索引器1.表的列索引import numpy as npimport pandas as pddf = pd.read_csv(r"C:\Users\zhoukaiwei\Desktop\joyful-pandas\data\learn_pandas.csv", usecols = ['School', 'Grade', 'Name', 'Gender', 'Weight', 'Transfer'])原创 2020-12-22 23:31:59 · 221 阅读 · 0 评论 -
pandas学习task02 pandas基础
一、文件的读取和写入1. 文件读取import numpy as npimport pandas as pddf_csv = pd.read_csv(r"C:\Users\zhoukaiwei\Desktop\CSV.csv")df_csv Unnamed: 0 clum1 clum2 clum3 time 0 0 a A原创 2020-12-20 02:33:17 · 540 阅读 · 1 评论