利用python进行
文章平均质量分 71
tonight1103
这个作者很懒,什么都没留下…
展开
-
Numpy基础:数组和矢量计算
Numpy本身并没有提供多么高级的数据分析功能,理解Numpy数组以及面向数组的计算将有助于你更加高效地使用诸如pandas之类的工具。虽然Numpy提供了大部分数据分析功能的计算基础,但你可能还是想将pandas作为数据分析工作的基础(尤其是对于结构化或表格化数据),因为他提供了能使大部分常见数据任务变得非常简洁的丰富高级接口。pandas还提供了一些Numpy所没有的更加领域特定的功能,如时间原创 2016-07-05 15:32:20 · 1375 阅读 · 0 评论 -
Pandas入门
pandas是基于Numpy构建的,让以Numpy为中心的应用变得更加简单。pandas的数据结构介绍 要使用pandas,你首先得熟悉它的两个主要数据结构:Series和DataFrame。1. Series 1.1. Series是一种类似于一维数组的对象,它由一组数据(各种Numpy数据类型)以及一组与之相关的数据标签(即索引)组成。由于我们没有为数据指定索引,于是会自动创建一个0到N-原创 2016-07-06 12:27:41 · 1800 阅读 · 0 评论 -
数据加载、存储与文件格式
输入输出通常可以划分为几个大类:1.读取文本文件和其他更高效的磁盘存储格式;2.加载数据库中的数据;3.利用Web API操作网络资源读写文本格式的数据 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数。pandas中的解析函数 read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号。read_table 从文件、URL、文件型对象中加载带分原创 2016-07-07 10:57:39 · 725 阅读 · 0 评论 -
数据规整化:清理、转换、合并、重塑
数据分析和建模方面的大量编程工作都是用在数据准备上的:加载、清理、转换以及重塑。有时候,存放在文件或数据库中的数据并不能满足你的数据处理应用的要求。许多人都选择使用通用编程语言(如python、perl、R或java)或UNIX文本处理工具(sed或awk)对数据格式进行专门处理。幸运的是,pandas和python标准库提供了一组高级的、灵活的、高效的核心函数和算法,它们使你能够轻松地将数据规整化原创 2016-08-05 16:13:08 · 810 阅读 · 0 评论 -
金融和经济数据应用
你如何利用本章中的工具去解决金融领域中的一些特殊问题。跟其他领域和分析领域一样,在数据规整化方面所花费的警力常常会比解决核心建模和研究问题所花费的要多得多。1.数据规整化方面的话题1.1 时间序列以及截面对齐 在处理金融数据时,最费神的一个问题就是所谓的”数据对齐”(data alignment)问题。手工处理数据对齐问题是一件令人非常郁闷的工作,而验证数据是否对齐则还要更郁闷些。不仅如此,合原创 2016-08-05 18:13:21 · 535 阅读 · 0 评论