Pandas使用过程中的总结

最新推荐文章于 2024-07-26 14:34:34 发布

WJZ.

最新推荐文章于 2024-07-26 14:34:34 发布

阅读量169

点赞数

分类专栏： Python 文章标签： Pandas

本文链接：https://blog.csdn.net/weixin_45257976/article/details/93471085

版权

4 篇文章 0 订阅

订阅专栏

pandas读取

	df = pd.read_csv(filepath, encoding="ISO-8859-1")
	# 当时的文件使用‘utf-8’仍然报错，在stackoverflow上找到"ISO-8859-1"解决问题，编码问题有空需要了解一下

按行读取，每一行转成list存放（不含表头

	for index, row in df.iterrows():
		get_list.append(row.tolist())

按列读取，index为表头，row为该列

	for index, row in df.iteritems():
		header_list.append(index)

df类似于字典，直接表头作为key读取该列

	name = 'name'
	data = df[name].tolist()

先创建字典，将字典转成DataFrame
原文链接
[外链图片转存失败(img-ZaLoWzWr-1562209845371)(https://pbpython.com/images/pandas-dataframe-shadow.png)]
由于字典是无序的，如果要保证dataframe的呈现按照一定的顺序：

	header_list = ['account','Jan','Feb','Mar'] # 将表头按顺序存放在list
	df = df[header_list] # dataframe按照result的顺序

		writer = pd.ExcelWriter(store_path)
		df.to_excel(writer, index=False) #index = True 则会在最左侧多一列index， 0-N
		writer.save()

<转> Pandas——ix vs loc vs iloc区别

dropna()
drop()
fillna()

DataFrame.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

value_counts()

函数可以对Series里面的每个值进行计数并且排序

关注