学习来源:http://fintech.ftwhale.com/home/courses/p08/lessons/ 机器学习部分
1.
# Step 1.从`sklearn.neighbors`导入`KNeighborsClassifier`。
from sklearn.neighbors import KNeighborsClassifier
# Step 2.为特征和目标变量创建数组`X`和`y`。
y = df['party'].values
X = df.drop('party', axis=1).values
# Step 3.创建一个具有6个近邻的K-NN分类器。
knn = KNeighborsClassifier(n_neighbors=6)
# Step 4.将数据传入分类器进行拟合。
knn.fit(X, y)
自学重点:
Step 3.创建一个具有6个近邻的K-NN分类器。
knn = KNeighborsClassifier(n_neighbors=6)
import numpy as np
import pandas as pd
# Step 2.将CSV文件读入DataFrame:df
df = pd.read_csv(os.path.join(data_path,'gapminder.csv'))
# Step 3.为要素和目标变量创建数组
y = df['life'].values #已知csv文件中有life列和fertility列
X = df['fertility'].values
# Step 5.重塑X和y为 :1行
y = y.reshape(-1, 1)
X = X.reshape(-1, 1)
# Step 6.打印重塑后X和y的维度
print("Dimensions of y after reshaping: {}".format(y.shape))
print("Dimensions of X after reshaping: {}".format(X.shape))
自学重点:
Step 3.为要素和目标变量创建数组
y = df[‘life’].values #已知csv文件中有life列和fertility列
X = df[‘fertility’].values
# Step 1.导入LinearRegression
from sklearn.linear_model import LinearRegression
# Step 2.创建回归模型:reg
reg = LinearRegression()
# Step 3.创建预测空间
#创建预测时特征'fertility'的取值,为变量X_fertility的最小值到最大值之间平均取50个值。
predicti