![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
心际花园
编程的主题是人如何处理信息的。编程就像一个迷宫,有无穷无尽的歧路,在其中的体验是有趣的。不必惆怅编程的无限性,重要的是体验过程,而不仅仅是获得结果。
展开
-
Pandas文本数据类型及处理
Pandas文本数据类型Pandas文本数据类型有object和string两种。pandas1.0之前只有文本数据只有object类型,pandas1.01.0之后有了string类型。如果一列数据中包含文本和数据,则会默认为object类型。import pandas as pdimport numpy as npdf = pd.DataFrame({ 'A':['a','b','c','d'], 'B':['aa','bb','cc',np.nan], 'C':[原创 2021-09-16 14:35:40 · 1576 阅读 · 0 评论 -
join的使用
df = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'], 'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})df other = pd.DataFrame({'key': ['K0', 'K1', 'K2'], 'B': ['B0', 'B1', 'B2']})other # 因为有一样的列存在,所以一定要原创 2021-05-25 23:22:33 · 184 阅读 · 0 评论 -
pd.concat操作
import numpy as np import pandas as pd s1 = pd.Series(['a', 'b'])s2 = pd.Series(['c', 'd'])# 对series的操作,ignore_index=True是重新排索引pd.concat([s1, s2], ignore_index=True)结果0 a1 b2 c3 ddtype: objectdf1 = pd.DataFrame([['a', 1], ['b',原创 2021-05-25 22:56:21 · 629 阅读 · 0 评论 -
pandas中DataFrame检测缺失值
df = pd.DataFrame(dict(age=[5, 6, np.NaN], born=[pd.NaT, pd.Timestamp('1939-05-27'), pd.Timestamp('1940-04-25')], name=['Alfred', 'Batman', ''], toy=[None, 'Batmobile', 'Joke原创 2021-05-25 15:50:42 · 731 阅读 · 0 评论 -
pandas中DataFrame如何去除重复值
df = pd.DataFrame({ 'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'], 'style': ['cup', 'cup', 'cup', 'pack', 'pack'], 'rating': [4, 4, 3.5, 15, 5]})df# 删除重复值后返回的是一个副本,也就是原来的数据不会改变。df.drop_duplicates() # ignore_index=Tru原创 2021-05-25 15:31:29 · 1694 阅读 · 0 评论 -
pandas中DataFrame如何检测重复值
DataFrame.duplicated(subset=None, keep='first')subset:如果你认为几个字段重复,则数据重复,就把那几个字段以列表形式放到subset后面。默认是所有字段重复为重复数据。keep:默认为’first’ ,也就是如果有重复数据,则第一条出现的定义为False,后面的重复数据为True。如果为’last’,也就是如果有重复数据,则最后一条出现的定义为False,后面的重复数据为True。如果为False,则所有重复的为True下面举例df原创 2021-05-25 15:13:11 · 13288 阅读 · 3 评论