现在最前
如果你动手做数据分析,你会发现上游提供的数据格式,到自己这里 往往需要加工或者转换。作为运维出身的人,怎么能不会一些数据转储的技巧呢?
要说存储格式,处理list 还有dict 和tuple, 除了array还有 series, 除了mysql的数据表 也还有 mongo 和redis ,文件方面除了 表格文件,可能还要考虑一下文本文件或者 xml html之类的, 我总是开头容易把问题想的比较多,今天下午也只能完成一小部分的验证。 当然如果,每种形式都要两两之间直接转换, 也是可以的,但是那样要记忆的东西太多了 ,还是有个中转的方式进行转换比较好,而且今天我发现 mysql数据,经过 pd.DataFrame 转换到list 可能比 直接转更方便呢
numpy的array和 pandas的DataFrame的转换作为基础, 而list 和array之间的互转搞定, mysql 还有文件形式他们和 DataFrame之间的转型搞定, 相当于说标题中的所有形式的数据转换,也就两道三步 就可以转型完成了
第0步:
# np 和 pandas 之间互转
import numpy as np
import pandas as pd
#from pandas import DataFrame
aa=np.arange(10).reshape(2,5)
bb=pd.DataFrame(aa)
print(type(bb))
print(bb)
cc=np.array(bb)
print(type(cc))
p