python----机器学习练习题1

本文介绍了Python机器学习中的K-NN分类器实践,包括创建K-NN分类器、数据预处理、训练测试集划分、交叉验证以及正则化方法的应用。重点讲解了5倍和3倍交叉验证的执行,以及如何使用Lasso和岭回归预防过拟合,并展示了混淆矩阵和分类报告的生成方法。
摘要由CSDN通过智能技术生成

学习来源:http://fintech.ftwhale.com/home/courses/p08/lessons/ 机器学习部分
1.

# Step 1.从`sklearn.neighbors`导入`KNeighborsClassifier`。
from sklearn.neighbors import KNeighborsClassifier

# Step 2.为特征和目标变量创建数组`X`和`y`。
y = df['party'].values
X = df.drop('party', axis=1).values

# Step 3.创建一个具有6个近邻的K-NN分类器。
knn = KNeighborsClassifier(n_neighbors=6)

# Step 4.将数据传入分类器进行拟合。
knn.fit(X, y)

自学重点:
Step 3.创建一个具有6个近邻的K-NN分类器。

knn = KNeighborsClassifier(n_neighbors=6)

import numpy as np
import pandas as pd
# Step 2.将CSV文件读入DataFrame:df
df = pd.read_csv(os.path.join(data_path,'gapminder.csv'))

# Step 3.为要素和目标变量创建数组
y = df['life'].values     #已知csv文件中有life列和fertility列
X = df['fertility'].values

# Step 5.重塑X和y为 :1行
y = y.reshape(-1, 1)
X = X.reshape(-1, 1)

# Step 6.打印重塑后X和y的维度
print("Dimensions of y after reshaping: {}".format(y.shape))
print("Dimensions of X after reshaping: {}".format(X.shape))

自学重点:
Step 3.为要素和目标变量创建数组

y = df[‘life’].values #已知csv文件中有life列和fertility列
X = df[‘fertility’].values

# Step 1.导入LinearRegression
from sklearn.linear_model import LinearRegression 

# Step 2.创建回归模型:reg
reg = LinearRegression()

# Step 3.创建预测空间
#创建预测时特征'fertility'的取值,为变量X_fertility的最小值到最大值之间平均取50个值。
predicti
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值