规划与启航
前言
我们要做一个农产品智能信息推荐系统
由我担任队长,首先,我们进行了两次大型会议,对于我们的需求、分工、首次迭代进度计划都有了明确的书面记录和规定。之后便可以开始进行正式的学习和编码操作了
一、CSV文件的读写
1.读取
代码如下:
fo = open("XXX.csv",encoding="utf-8")
ls = []
for line in fo:
line = line.replace("\n","")
ls.append(line.split(","))
fo.close()
注意,发生下列问题是没有加上encoding=“utf-8”
2.写出
代码如下:
fw = open("price.csv","w",encoding="utf-8")
for item in ls:
fw.write(','.join(item)+'\n')
fw.close()
二、独热编码
示例代码如下:
import numpy as np
print([ [0], [1], [2],[2],[0],[1] ])
data = np.array([ [0], [1], [2],[2],[0],[1] ])
from sklearn import preprocessing
enc = preprocessing.OneHotEncoder(sparse=False)
data = enc.fit_transform( data )
print(data)
具体很容易理解,一般如果想将例如互不相关的种类作为特征时,可以将这些数据进行独热码处理。