pandas
pennyyangpei
这个作者很懒,什么都没留下…
展开
-
Pandas数据分析工具入门(Series&Dataframe)
一、Pandas简介 Pandas是一个Python软件包,提供快速,灵 活和富有表现力的数据结构,旨在使“关系” 或“标记”数据的工作变得简单直观。 Pandas 纳入了大量库和一些标准的数据模 型,提供了高效地操作大型数据集所需的工具以及大量能使我们快速便捷地处理数据的函数和方法。 Pandas最初被作为金融数据分析工具而开发 出来,因此,pandas为时间序列分析提供了...原创 2018-06-21 18:13:29 · 1322 阅读 · 0 评论 -
Pandas高阶篇七(数据的聚合及分组计算)
对数据集进行分组并对各组应用一个函数(无论是聚合还是转 换),这是数据分析工作中的重要环节。在将数据集准备好之后,通常的任务就是计算分组统计或生成透视表。pandas提供了一个灵活高效的gruopby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作 。...原创 2018-06-25 19:54:10 · 597 阅读 · 1 评论 -
Pandas高阶篇七(读取文件数据)
Pandas中的数据加载、存储与解析1.读取csv文件导入模块from pandas import Series,DataFrameimport pandas as pdimport numpy as npfrom numpy import nan as NAimport sys用read_csv读取csv文件pd.read_csv("data/ex1.csv")...原创 2018-06-25 19:34:06 · 535 阅读 · 0 评论 -
Pandas高阶篇六(数据的过滤和筛选)
from pandas import Series,DataFrameimport pandas as pdimport numpy as npfrom numpy import nan as NA from matplotlib import pyplot as pltnp.random.seed(12345)data = np.random.randn(1000,4) #1000...原创 2018-06-25 17:11:54 · 17140 阅读 · 1 评论 -
Pandas高阶篇五(数据的拆分与分割)
数据的拆分 pandas返回的是一个 特殊的 Categorical对象。 你可以将其看做一组表 示面元名称的字符串。 实际上,它含有一个表示 不同分类名称的levels数 组以及一个为年龄数据 进行标号的labels属性。 跟“区间”的数学符号 一样,圆括号表示开端,而 方括号则表示闭端(包括)。 哪边是闭端可以通过right. 也可以自定义label名称。...原创 2018-06-25 14:20:36 · 35702 阅读 · 2 评论 -
Pandas高阶篇四(数据的替换)
利用fi11na方法填充缺失 数据可以看做值替换的一种特殊情况。虽然前面提到的map 可用于修改对象的数据子集, 而replace则提供了一种实现 该功能的更简单、更灵活的方 式。 也可以利用 replace传替一个数组来替换多个值。 如果希望替换多个值,也可以通过一个数据进行。...原创 2018-06-22 19:34:27 · 3189 阅读 · 0 评论 -
Pandas高阶篇三(数据转化、清除重复数据)
数据转换-清除重复数据 Data frame的 duplicated方 法返回一个布尔型 Series, 表示各行是否是重复行: 还有一个与此相关的drop duplicates方法,它用于返回一个移除了重复行的DataFrame 这两个方法默认会判断 全部列,你也可以指定部分列进行重复项判断。 假设你还有一列值,且只希望根据k1列过滤重复 项: duplicate...原创 2018-06-22 19:28:38 · 6828 阅读 · 0 评论 -
Pandas高阶篇二(数据的重塑和旋转)
层次化索引与数据重塑 层次化索引是 pandas的一 项重要功能,它使你能在一个轴上拥有多个(两个以上)索引级别。抽象点说,它使你能以低维度形式处理高维度数据。 层次化索引为Dataframe数据的重排任务提供了一种具有良好一致性的方式。主要功能有二 • stack:将数据的列“旋转”为行 • unstack:将数据的行“旋 转”为列 对于一个层次化索引的 ...原创 2018-06-22 19:15:21 · 920 阅读 · 0 评论 -
Pandas高阶篇一(数据合并)
Pandas中的时间序列 pandas对象中的数据可以通过一些内置的方式进行合并: • pandas. merge可根据一个或多个键将不同Data frame中的行连 接起来。SQL或其他关系型数据库的用户对此应该会比较熟悉,因 为它实现的就是数据库的连接操作。· • pandas, concat可以沿着一条轴将多个对象堆叠到一起 • combine first可以将...原创 2018-06-22 19:01:24 · 801 阅读 · 0 评论 -
Pandas快速进阶六(Pandas中的时间序列)
Pandas中的时间序列 pandas通常是用于处理成 组日期的,不管这些日期是 DataFrame的轴索引还是列。 to_datetime方法可以解析 多种不同的日期表示形式。 对标准日期格式(如 ISO8601)的解析非常快。 • 它还可以处理缺失值 • NaT: (not a time) 是pandas 中时间戳数据的NA值...原创 2018-06-22 17:31:32 · 1439 阅读 · 0 评论 -
Pandas数据分析工具快速进阶四(字符串操作技巧)
9.字符串操作技巧原创 2018-06-22 11:04:09 · 187 阅读 · 0 评论 -
Pandas数据分析工具快速进阶四(字符串操作技巧)
9.字符串操作技巧原创 2018-06-22 10:03:50 · 220 阅读 · 0 评论 -
Pandas数据分析工具快速进阶三(value_counts与apply结合使用&简单的统计函数)
7. value_counts与apply结合使用 8.简单的统计函数原创 2018-06-21 20:14:18 · 1645 阅读 · 0 评论 -
Pandas数据分析工具快速进阶二(数据计算&函数应用和映射)
5.数据计算 6.函数应用和映射原创 2018-06-21 20:02:15 · 255 阅读 · 0 评论 -
Pandas数据分析工具快速进阶一(索引的选取和过滤&缺失值的处理&索引的排序)
一、Pandas快速进阶主要包括以下内容 1. Series与DataFrame中的索引2.索引的选取和过滤 3. 索引的排序 4.缺失值处理原创 2018-06-21 19:43:25 · 487 阅读 · 0 评论 -
Pandas高阶篇八(神奇的apply方法)
apply会将 待处理的对象拆分成多 个片段,然后对各片段 调用传入的函数,最后 尝试将各片段组合到一 起。 ……原创 2018-06-25 20:08:19 · 1226 阅读 · 0 评论