pandas
mz_老张
这个作者很懒,什么都没留下…
展开
-
pandas水平concat后出现NaN值
pandas水平拼接result = pd.concat([df1, df2, df3,...], axis=1)问题原因:如果排除本身每个df自身有NaN值外,出现这种情况就是各df的索引顺序不统一。你可能是随机抽取的df数据,所以索引不一致。解决办法:重置索引方法一:使用reset_index重置df = df.reset_index(drop=True)drop=True表示删除原索引(可以理解为覆盖原索引),为False时,则会保留原索引,新增一列重置索引方法二:直接替换原创 2021-07-09 10:37:48 · 4212 阅读 · 0 评论 -
pandas读存列表、字典以及其它数据类型
pandas读存列表字典即其它数据类型pandas的每列除了存入常见的float,str,int外,还可以存入list,dict以及其他类型的元素.事实上,无论什么类型元素都可以正常写入pandas当中。import pandas as pdclass CGAI(object): def __init__(self,num): super(CGAI, self).__init__()a={'A':[1,2,3],'B':[4,5,6],'C':['q q','w原创 2020-12-29 19:27:31 · 2060 阅读 · 0 评论 -
关于pandas中df[[]]的解谜以及Series与DataFrame的区别
关于pandas中df[[]]的解谜以及Series与DataFrame的区别一直以来我们获取df中某列的值,一般采用df.parm或者df[‘parm’]的方式来获取。今天突然遇到df[[‘number’]]的形式,一开始以为别人写错了,后来才知道原来是取的东西不一样。先看对比代码:import pandas as pddata=pd.DataFrame({'name':['张三','李四','王五'],'age':[18,19,20],'number':[190,200,220]})prin原创 2020-12-21 17:17:48 · 3478 阅读 · 0 评论 -
pandas apply执行函数3点注意
pandas apply执行函数3点注意import pandas as pddata=pd.DataFrame({'name':['张三','李四','王五'],'age':[18,19,20],'number':[190,200,220]})print(data)使用apply可以将df中指定的列全部执行该函数并返回结果需要注意的有3点:1.函数传入的执行对象要对df中的某列执行函数,那函数执行的对象自然是该列,但是函数怎么知道是该列的数据呢。apply默认对第一个参数视为传入的原创 2020-12-21 15:49:37 · 808 阅读 · 1 评论 -
Pandas提取指定行列
取列1.通过列名称来提取指定列(推荐)#列名:irline_sentiment_gold name negativereason_gold retweet_count text get_data=data[['airline_sentiment','text']]2.通过loc函数传入列名称来获取列(推荐)loc : location 指定列名的位置data.loc[:,'text'] #获取列名为text的那一列3.通过iloc函数传入切片获取列iloc : i原创 2020-11-14 00:15:07 · 31738 阅读 · 3 评论