【pandas常见问题】---

这里写自定义目录标题

【pandas常见问题】

data = pd.read_csv('out.csv',delimiter=',')
datas = data[data.author_id==data.viewer_id]['author_id']
print(type(datas))#<class 'pandas.core.series.Series'>
datas = data[data.author_id==data.viewer_id][['author_id']]
print(type(datas))#<class 'pandas.core.frame.DataFrame'>
# datas = data[data.author_id==data.viewer_id][['author_id']].unique()
# print(datas)#AttributeError: 'DataFrame' object has no attribute 'unique'
datas = data[data.author_id==data.viewer_id]['author_id'].unique()
print(type(datas)) #<class 'numpy.ndarray'>
print(datas) #['--' '7' '4']
print(type(datas.tolist()))#<class 'list'>
print(datas.tolist())#['--', '7', '4']
c = pd.DataFrame(datas,columns=['id']).sort_values(by='id',ascending=True)
print(c)
c = pd.DataFrame(datas.tolist(),columns=['id']).sort_values(by='id',ascending=True)
print(c)
c = pd.DataFrame(set(datas.tolist()),columns=['id']).sort_values(by='id',ascending=True)
print(c)
c = pd.DataFrame(tuple(datas.tolist()),columns=['id']).sort_values(by='id',ascending=True)
print(c)

1、unique()只针对series操作,操作以后的结果是narray格式,可以通过tolist()转化为列表
2、datas = data[data.author_iddata.viewer_id][[‘author_id’]],datas是Dataframe格式
3、datas = data[data.author_id
data.viewer_id][‘author_id’],datas是Series格式
4、pands对任何数据结构的数据都可以操作为dataframe。

narray:
pd.DataFrame(datas,columns=['id'])
list:
pd.DataFrame(datas.tolist(),columns=['id'])
tuple:
pd.DataFrame(tuple(datas.tolist()),columns=['id'])
set:
pd.DataFrame(set(datas.tolist()),columns=['id'])
dict:
dic = {i+1:tuple(i) for i in range(3)}
pd.DataFrame(dic,columns=['id'])
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值