python----机器学习练习题1

最新推荐文章于 2024-08-10 00:28:48 发布

葑歆

最新推荐文章于 2024-08-10 00:28:48 发布

阅读量2.2k

点赞数

本文链接：https://blog.csdn.net/weixin_43584807/article/details/90073533

版权

本文介绍了Python机器学习中的K-NN分类器实践，包括创建K-NN分类器、数据预处理、训练测试集划分、交叉验证以及正则化方法的应用。重点讲解了5倍和3倍交叉验证的执行，以及如何使用Lasso和岭回归预防过拟合，并展示了混淆矩阵和分类报告的生成方法。

摘要由CSDN通过智能技术生成

学习来源：http://fintech.ftwhale.com/home/courses/p08/lessons/ 机器学习部分
1.

# Step 1.从`sklearn.neighbors`导入`KNeighborsClassifier`。
from sklearn.neighbors import KNeighborsClassifier

# Step 2.为特征和目标变量创建数组`X`和`y`。
y = df['party'].values
X = df.drop('party', axis=1).values

# Step 3.创建一个具有6个近邻的K-NN分类器。
knn = KNeighborsClassifier(n_neighbors=6)

# Step 4.将数据传入分类器进行拟合。
knn.fit(X, y)

自学重点：
Step 3.创建一个具有6个近邻的K-NN分类器。

knn = KNeighborsClassifier(n_neighbors=6)

import numpy as np
import pandas as pd
# Step 2.将CSV文件读入DataFrame：df
df = pd.read_csv(os.path.join(data_path,'gapminder.csv'))

# Step 3.为要素和目标变量创建数组
y = df['life'].values     #已知csv文件中有life列和fertility列
X = df['fertility'].values

# Step 5.重塑X和y为 :1行
y = y.reshape(-1, 1)
X = X.reshape(-1, 1)

# Step 6.打印重塑后X和y的维度
print("Dimensions of y after reshaping: {}".format(y.shape))
print("Dimensions of X after reshaping: {}".format(X.shape))

自学重点：
Step 3.为要素和目标变量创建数组

y = df[‘life’].values #已知csv文件中有life列和fertility列
X = df[‘fertility’].values

# Step 1.导入LinearRegression
from sklearn.linear_model import LinearRegression 

# Step 2.创建回归模型：reg
reg = LinearRegression()

# Step 3.创建预测空间
#创建预测时特征'fertility'的取值，为变量X_fertility的最小值到最大值之间平均取50个值。
predicti