pandas中一个很便捷的使用方法通过loc、iloc、ix等索引方式,这里记录一下:
df.loc[条件,新增列] = 赋初始值
如果新增列名为已有列名,则在原来的数据列上改变
import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randint(0,100,40).reshape(10,4),columns=list('abcd'))
print(data)
data.loc[data.d >= 50,'大于50'] = 'Yes'
print(data)
通过使用loc进行索引,在索引中做判断,然后根据判断的结果给新增的列赋值。这是很方便很基础的操作,当然我最近记得不太清楚所以这里记录一下。