python数据框新建一个列并赋值_tidyfst vs pandas(4):数据框的使用

本文探讨了Python的Pandas DataFrame与R数据框的差异,特别是在新建列和赋值方面。作者指出Python中range函数的使用可能对非计算机背景用户不友好,而Pandas的索引对齐特性可能带来潜在问题。建议在数据处理时,考虑自定义索引列以增强灵活性。
摘要由CSDN通过智能技术生成

作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量、机器学习、数据可视化、应用统计建模、知识图谱等,著有《R语言高效数据处理指南》(《R语言数据高效处理指南》(黄天元)【摘要 书评 试读】- 京东图书)。知乎专栏:R语言数据挖掘。邮箱:huang.tian-yuan@qq.com.欢迎合作交流。

数据框在R中是原生的数据结构,而Python中则没有,也就是没有Pandas就没有dataframe的一种状况。下面我们来用Jupyter Notebook Viewer中提供的代码来查看pandas中数据框的特性,代码如下:

>>> import pandas as pd
>>> import numpy as np
>>> 
>>> # (a)创建一个DataFrame
>>> df = pd.DataFrame({'col1':list('abcde'),'col2':range(5,10),'col3':[1.3,2.5,3.6,4.6,5.8]},
...                  index=list('一二三四五'))
>>> df
  col1  col2  col3
一    a     5   1.3
二    b     6   2.5
三    c     7   3.6
四    d     8   4.6
五    e     9   5.8
>>> 
>>> # (b)从DataFrame取出一列为Series
>>> df['col1']
一    a
二    b
三    c
四    d
五    e
Name: col1, dtype: object
>>> type(df)
<class 'pandas.core.frame.DataFrame'>
>>> type(df['col1'])
<class 'pandas.core.series.Series'>
>>> 
>>> # (c)修改行或列名
>>> df.rename(index={'一':'one'},columns={'col1':'new_col1'})
    new_col1  col2  col3
one        a     5   1.3
二          b     6   2.5
三          c     7 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值