今天开始数据挖掘短租房屋的建模过程,其中有一个excel数据表中的价格为字符串类型,需要转化为数值才能进行后续的数据挖掘。
在网上寻找了很久的解答过程,终于解决了如下的问题。
inputcalender = '../SrcData/calendar_detail.csv'
outputcalender = '../NewData/calendar_detail.xlsx'
data = pd.read_csv(inputcalender)
data = data.iloc[:100000, :]
data['test1'], data['price'] = data['price'].str.split('$').str
data['test2'], data['adjusted_price'] = data['adjusted_price'].str.split('$').str
data.to_excel(outputcalender)
data['price'] 是需要获取的价格,用str转换为再用split分割这个美元符号,就获得了两个字符串,其中第一个就就是空字符串,第二个才是数值型的字符。就得到了想要的价格。