python 大数据入门之pandas

人工智能-肥鹅

已于 2022-06-27 10:24:08 修改

阅读量218

点赞数

分类专栏： Python 文章标签： Pandas 数据处理 CSV 全栈程序员数据帧转换

于 2022-03-22 11:01:02 首次发布

本文链接：https://blog.csdn.net/kfyzjd2008/article/details/108139937

版权

38 篇文章 1 订阅

订阅专栏

作为一名全栈程序员，广种薄收，我也很苦恼，但是又没有办法，自己是块砖，哪里需要哪里搬。

常用的pandas命令和技巧：

1、读取CSV文件：

data = pd.read_csv("{路径.csv}")

2、读取部分CSV文件：

data = pd.read_csv("E:/豪总导出数据/hw_register_user_20220317.csv",nrows=500)

3、查看某一列数据：

data['首次充值时间']

4、更改某一列数据：

data['首次充值时间'] = data['首次充值时间'].replace("-", "1970-01-01 08:00:00")
#此处是将“-”替换为日期再赋值给‘首次充值时间’

5、查询指定值数据：

data.loc[data["phone"]=='00004E34633A22C355506CE983BC30D5',:]

6、查看数据结构

data.info()

7、查看N条数据

data.head(10)

8、保存数据到CSV文件

df.to_csv('save_path', header=None, index=None)#header第一行,index第一列(默认数字)
#mode = 'a'为追加数据
df.to_csv('save_path', mode='a', header=None, index=None)

9、python列表转dataframe：

#phone_decode = ["a","b","c","d"]
df1 = pd.Series(phone_decode)

10、python列表转numpy

lst = [["a","b"],["c","d"]]
nlst = np.array(lst)

输出：
[['a' 'b']
 ['c' 'd']]

11、numpy转pandas.DataFrame：

df = pd.DataFrame(nlst,index=["xx","yy"],columns=["xxx","yyy"])

12、解决pandas保存中文乱码：

df.to_csv('changed.csv', header=None, index=None, encoding='utf_8_sig')

关注

专栏目录