一、建立时间预测器
1.准备工作
我们所获得的数据集主要来源于课本配套网站,我们首先看building_event_binary.txt文件中6个字符串数据的排序:
星期、日期、时间、离开大楼的人数、进入大楼的人数、是否有活动
前5个字段组成输入数据,我们的任务是预测大楼是否举行活动。
building_event_multiclass.txt文件星期、日期、时间、离开大楼的人数、进入大楼的人数、活动类型
2.详细步骤
首先将数据全部加在X中:
import numpy as np
from sklearn import preprocessing
from sklearn.svm import SVC
input_file = 'building_event_binary.txt'
#读取数据
X = []
count = 0
with open(input_file,'r') as f:
for line in f.readlines():
data = line[:-1].split(',')
X.append([data[0]] + data[2:])
X = np.array(X)
下面将字符串格式转换成数值格式
label_encoder = []
X_encoder = np.empty(X.shape)
for i,item in enumerate(X[0]):
if item.isdigit():
X_encoder[:,i] = X[:,i]
else:
label_encoder.append(preprocessing.LabelEncoder())