作为一名全栈程序员,广种薄收,我也很苦恼,但是又没有办法,自己是块砖,哪里需要哪里搬。
常用的pandas命令和技巧:
1、读取CSV文件:
data = pd.read_csv("{路径.csv}")
2、读取部分CSV文件:
data = pd.read_csv("E:/豪总导出数据/hw_register_user_20220317.csv",nrows=500)
3、查看某一列数据:
data['首次充值时间']
4、更改某一列数据:
data['首次充值时间'] = data['首次充值时间'].replace("-", "1970-01-01 08:00:00")
#此处是将“-”替换为日期再赋值给‘首次充值时间’
5、查询指定值数据:
data.loc[data["phone"]=='00004E34633A22C355506CE983BC30D5',:]
6、查看数据结构
data.info()
7、查看N条数据
data.head(10)
8、保存数据到CSV文件
df.to_csv('save_path', header=None, index=None)#header第一行,index第一列(默认数字)
#mode = 'a'为追加数据
df.to_csv('save_path', mode='a', header=None, index=None)
9、python列表转dataframe:
#phone_decode = ["a","b","c","d"]
df1 = pd.Series(phone_decode)
10、python列表转numpy
lst = [["a","b"],["c","d"]]
nlst = np.array(lst)
输出:
[['a' 'b']
['c' 'd']]
11、numpy转pandas.DataFrame:
df = pd.DataFrame(nlst,index=["xx","yy"],columns=["xxx","yyy"])
12、解决pandas保存中文乱码:
df.to_csv('changed.csv', header=None, index=None, encoding='utf_8_sig')