![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Pandas
pandas小技巧
理竹子
对人工智能技术感兴趣的小白程序员。
展开
-
将pandas.DataFrame格式的数据,每一行转为元组tuple,所有数据以列表list输出
import pandas as pddf = pd.DataFrame([[1, 2, 3, 4], [5, 6, 7, 8], [1, 4, 5, 2]], columns=['a', 'b', 'c', 'd'])print(df)df = df.apply(lambda x: tuple(x), axis=1).values.tolist()print(df)输出结果: a b c d0 1 2 3 41 5 6 7 82 1 4 5 2[原创 2021-04-13 15:34:18 · 6454 阅读 · 2 评论 -
使用pandas去重,要求某两列对应的行不一样时才去重
import pandas as pdimport numpy as npdf_org = pd.DataFrame([[102, '2014/2/11 12:01', '其他', 15], [102, '2014/2/11 12:01', '尿常规', 1], [102, '2015/3/03 13:23', '血常规', 0.02], [102, '2015/3/03 13:23', '尿常规', 0],原创 2021-02-07 17:20:31 · 949 阅读 · 0 评论 -
利用pandas将某一列数据按照ID由列变成行,并在对应的列填值
原文件:df_org = pd.DataFrame([[807, '其他', 15], [807, '尿常规', 1], [2421, '尿常规', 0], [2421, 'PTH', 300], [878, 'PTH', 312], [878, '血常规', 0.018]],原创 2021-01-18 23:21:37 · 778 阅读 · 0 评论 -
pandas保存为Excel文件时小数位数增多的原因
保存Excel要求float64,如果转换了数据类型,同时指定小数位数,此时保存会导致数据位数增多。所以,保存原数据,需要把数据类型改为float64df = pd.DataFrame([[0.862513, 0.2354]])print(df.dtypes)print(df)df = df.astype(np.float32)df = pd.DataFrame.round(df, 4)print(df.dtypes)df.to_excel('test01.xlsx') # 即使保留4原创 2020-12-11 18:55:49 · 3285 阅读 · 1 评论 -
纯小白常用的Pandas指令
文章目录Pandas取出部分行或列的数据删除列或行删除有空值的行或列填充值判断是否是空值数据拼接在特定的行对应特定的列填值分组移动列的位置(先删除再插入)统计某一列或某一行的缺失值数目统计非空值数量Pandas取出部分行或列的数据import pandas as pddf = pd.DataFrame(pd.read_excel(path, header=0, encoding='utf-8'))df = df.iloc[:, [0, 3, -1]] # 取出第0 3 和最后1列的数据df原创 2020-09-04 13:17:18 · 120 阅读 · 0 评论 -
删除列中的重复数据
df_data = pd.DataFrame.drop_duplicates(data, subset=c, keep="first", inplace=False)原创 2020-09-04 12:03:55 · 112 阅读 · 0 评论 -
不为空的值改为0空值填1
df_data[pd.isna(df_data)==False] = 0df_data[pd.isna(df_data)] = 1df_data = df_data.astype(np.int32)原创 2020-09-04 10:38:34 · 459 阅读 · 0 评论