pandas
TristaCchi
管理学girl学技术
展开
-
spark中间结果的存储
spark中如果有中间结果(如抽样结果)需要存储,有两种方式,直接存为rdd,或者collect出来,再存储。存储为rddrdd.saveAsPickleFile("hdfs://ip/rdd")可直接使用。存储为dataframeimport picklerdd_collect = rdd.collect()f1 = open("/root/rdd_collect ....原创 2018-09-10 13:07:07 · 4863 阅读 · 0 评论 -
解决报错DtypeWarning: Columns (2) have mixed types.
解决报错DtypeWarning: Columns (2) have mixed types。今天在使用pandas读取csv的时候,语句为:df_question1 = pd.read_csv("D:/data/final/question20181201.csv",usecols=[2,4,15])出现了类型报错,报错内容如下:D:\Anaconda\lib\site-package...原创 2019-02-06 09:26:49 · 14817 阅读 · 0 评论 -
Pandas DataFram常用操作总结
最近经常用到dataframe,经常用的时候百度,用完就忘了,下次用的时候还要再次百度,所以在这里整理一下,以备后需。1 dataframe列操作首先新建一个dataframe,读取文件import pandas as pddf_test = pd.DataFrame("D:/data/test.csv")1.1 列命名假设有五行df_test.columns = ["id","...原创 2019-04-01 19:41:25 · 4527 阅读 · 0 评论 -
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd1 in position 0: invalid continuation byte
今天读取csv时遇到了报错如下:nicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd1 in position 0: invalid continuation byte原本的代码doctor_info = pd.read_csv("F:/master/offline_of_teamwork/team_doctor_infomation....原创 2019-07-15 21:29:41 · 3475 阅读 · 0 评论