在data science领域,pandas是python最常用的library,而DataFrame又是pandas最核心的数据结构。用久了,发现与pandas DataFrame相关的常用的方法其实就那么几个,只要能熟练掌握便能解决大部分需求了。
1. Create a pandas DataFrame
如果数据已经以list的形式存在了的话,最常用的方法是直接pass in 一个字典,比如:
import pandas as pd
name_lst = ['John','Mike']
age_lst = [12,30]
city_lst = ['New York City','Paris']
df = pd.DataFrame({
'name':name_lst,'age':age_lst,'city':city_lst})
如果没有,可以创建一个空DataFrame,再以append的方式(见下文)添加行。(columns
参数定义了列的名字,是optional的。)
df = pd.DataFrame(columns=['name','age','city'])