有时在数据分析中需要将字符串转换为数字(整数/浮点数)。对于每个字符串,我们可以分配一个唯一的整数值来区分字符串值。
为此,我们使用逗号分隔值(CSV)文件中的数据。假设我们有一个包含CSV数据的Excel文件,如下所示-公司行业建议HDFC银行金融保持
阿波罗卫生保健购买
英雄汽车表现不佳
是的银行金融保持
并购汽车表现不佳
富通卫生保健购买
马鲁蒂汽车表现不佳
上面只是来自大型数据集的几行,我们需要给出不同的建议,即买入,持有,表现不佳等整数值,它们将链接到我们的元数据。因此,对于上述输入,我们的预期输出将类似于-公司行业建议HDFC银行金融2
阿波罗卫生保健1
英雄汽车3
是的银行金融2
并购汽车3
富通卫生保健1
马鲁蒂汽车3
这是将我们的字符串(列值)替换为整数的一种方法。
代码1#Import required library
import pandas as pd
#Import the CSV file into Python using read_csv() from pandas
dataframe = pd.read_csv("data_pandas1.csv")
#Create the dictionary of key-value pair, where key is
#your old value(string) and value is your new value(integer).
Recommendation = {'Buy': 1, 'Hold': 2, 'Und