- Pandas是数据再加工过程中使用的最广泛的工具,它包含为使数据分析更加快速便捷而设计的高级数据结构与数据操作工具。
- Pandas基于NumPy开发,它不仅提供了很多方法和函数,使得处理数据更容易;而且它已经优化了运行速度,与使用Python内置函数进行数据处理相比,这个一个显著的优势。
- NumPy、SciPy和Pandas三者构成了Python科学计算的支柱。
Series对象
- Series对象除了支持使用位置作为下标存取元素之外,还可以使用索引标签作为下标存取元素,这个功能与Python的字典(dictionary)对象类似
- 属性:index和values
DataFrame对象
创建对象
- 指定全部数据+行索引+列名
df = pd.DataFrame(np.random.randn(6,4), index = np.arange(0,6), columns = list("ABCD"))
- 从字典转换得到,假如字典内的数据长度不同,以最长的数据为准