pandas 处理格式化数据的利器。 本文会不断更新
1. DataFram
1.1 使用字典构造
>>> import pandas as pd
>>> d = {
'doc':['txt1'], 'nid':[100]}
>>> df = pd.DataFrame(data=d, columns=('nid', 'doc'))
>>> df
nid doc
0 100 txt1
>>>
>>> d2 = {
'doc':['txt1', 'txt2'], 'nid':[100, 200]}#多个成员, 字典value的长度相等
>>> df2 = pd.DataFrame(data=d2, columns=('nid', 'doc'))
>>> df2
nid doc
0 100 txt1
1 200 txt2
1.2 add 用于成员追加成份
1.2.1 单成员DataFrame追加
>>> import pandas as pd
>>> d = {
'doc':['txt1'], 'nid':[100]}
>>> df = pd.DataFrame(data=d, columns=('nid', 'doc'))
>>> d2 = {
'doc':['txt2'], 'nid':[200]}
>>> df
nid doc
0 100 txt1
>>> df = df.add(pd.DataFrame(d2)