1. pandas 是一种列存数据分析 API。它是用于处理和分析输入数据的强大工具
pandas 中的主要数据结构被实现为以下两类:
DataFrame
,您可以将它想象成一个关系型数据表格,其中包含多个行和已命名的列。Series
,它是单一列。DataFrame
中包含一个或多个Series
,每个Series
均有一个名称。DataFrame.describe
来显示关于DataFrame
的有趣统计信息。- 另一个实用函数是
DataFrame.head
,它显示DataFrame
的前几个记录 - pandas 的另一个强大功能是绘制图表。例如,借助
DataFrame.hist
,您可以快速了解一个列中值的分布 - 调用
DataFrame.reindex
以手动重新排列各行的顺序,reindex
输入数组包含原始DataFrame
索引值中没有的值,reindex
会为此类“丢失的”索引添加新行,并在所有对应列中填充NaN
值, - 函数
random.permutation
会随机排列其值的位置。如果使用此重新随机排列的数组调用reindex
,会导致DataFrame
行以同样的方式随机排列 np.random.permutation(cities.index)