Task3 数据预处理

最新推荐文章于 2023-09-03 14:57:22 发布

CheeU-roow

最新推荐文章于 2023-09-03 14:57:22 发布

阅读量330

点赞数

本文链接：https://blog.csdn.net/Miuwa/article/details/88907393

版权

步骤记录

1.读取数据用Jupter Notebook传入数据时老是报错，这个时候采用将csv文件以记事本格式打开，然后另存为，把下面的编码形式转换为utf-8。

import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
data = pd.read_csv('data2.txt',encoding = 'utf-8')
print(data.head())
print(data.info())

print(data.head())打印数据集的前五行，由于本次数据集的列数很多，只截取一部分
打印前五行
print(data.info())打印数据集的信息，仍然只截取一部分
数据集信息

2.将标签数据标记为Y

X = data.drop('status',axis=1)
Y = data['status']

3.无关特征删除

删除对结果影响不大的特征

‘b

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CheeU-roow

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Task3 数据预处理

步骤记录1.读取数据用Jupter Notebook传入数据时老是报错，这个时候采用将csv文件以记事本格式打开，然后另存为，把下面的编码形式转换为utf-8。import numpy as npimport pandas as pdfrom sklearn.preprocessing import StandardScalerfrom sklearn.model_selection ...
复制链接

扫一扫