接上一篇博客,接下来重点介绍一下Dataframe
三、DataFrame使用
DataFrame是一种二维的数据结构,非常接近于excel。它的竖行称之为 columns,横行跟前面的 Series 一样,称之为 index,也就是说可以通过 columns 和 index 来确定一个主句的位置。
1、导入
import pandas as pd
2、建立DataFrame
df1=pd.DataFrame(np.random.randn(4,4),index=[‘1’,‘2’,‘3’,‘4’],columns=[‘a’,‘b’,‘c’,‘d’])
df1
a b c d
1 -1.053798 1.362923 -0.123380 0.597046
2 0.371526 0.641591 1.330379 -0.048088
3 -0.729223 -0.748537 -1.048205 -0.798209
4 -2.357540 -0.650935 1.093724 -1.824537
或者用嵌套字典的方式
newdata = {‘lang’:{‘first’:‘python’,‘second’:‘java’},‘price’:{‘first’:5000,‘second’:2000}}
df2 = pd.DataFrame(newdata)
df2
lang price
first python 5000
second java 2000
3、DataFrame操作
df = pd.DataFrame({“id”:[1,2,3,4,5,6],
“date”:pd.date_range(‘20130102’, periods=6),
“city”:['Beijing ', ‘SH’, ’ guangzhou ', ‘Shenzhen’