在实际机器学习、深度学习场景下,我们开始拿到的数据其实可能是这样的
需要将数值做一个替换,变成:
原有值 | 替换后 |
---|---|
pos | 1 |
neg | 0 |
可以使用pandas包的apply去快速处理大批量的数据
import pandas
data = {"label": ["pos", "neg", "neg", "neg", "pos", "pos"]}
date_frame = pandas.DataFrame(data)
date_frame["label"] = date_frame['label'].apply(lambda x: 1 if x == "pos" else 0)
print(date_frame)