Pandas 笔记
import pandas as pd
print(pd.__version__)
mydataset = {
'sites' : ["Google", "Runoob", "Wiki"],
'number' : [1, 2, 3]
}
myvar = pd.DataFrame(mydataset)
print(myvar)
'''
Pandas Series 类似表格中的一个列 (column),类似于一维数组,可以保存任何数据类型
Series 由索引 (index) 和列组成
pandas.Series(data, index, dtype, name, copy)
data 一维数组 (ndarray 类型)
index 数据索引标签,如果不指定,默认从 0 开始
dtype 数据类型
name 设置名称
copy 拷贝数据,默认为 false
'''
a = [1, 2, 3]
myvar = pd.Series(a)
print(myvar)
'''
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型 (数值、字符串、
布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典 (共用一个索引)。
idx Column-1 Column-2 ... Column-k
... ... ... ... ...
pandas.DataFrame(data, index, columns, dtype, copy)
data 一组数据 (ndarry、series、map、lists、dict 等类型)
index 索引值,或者可以称为行标签
columns 列标签,默认为 RangeIndex (0, 1, 2, 3, ..., n)
dtype 数据类型
copy 拷贝数据,默认为 false
'''
data = [
['Google', 10], ['Runoob', 12], ['Wiki', 13]
]
df = pd.DataFrame(data, columns = ['Site', 'Age'], dtype = float)
print(df)
data = {
"calories": [420, 380, 390],
"duration": [50, 40, 45]
}
df = pd.DataFrame(data)
print(df.loc[0])
print(df.loc[1])
df = pd.read_csv('nba.csv')
print(df)
print(df.to_string())
print(df.head())
print(df.info())
URL = 'https://static.runoob.com/download/sites.json'
df = pd.read_json(URL)
print(df)