学习笔记

最新推荐文章于 2023-06-13 12:00:30 发布

data_bigbing

最新推荐文章于 2023-06-13 12:00:30 发布

阅读量128

点赞数

本文链接：https://blog.csdn.net/qq_41795577/article/details/89303927

版权

这篇博客主要介绍了Python数据科学的学习过程，首先提到导入常用的数据科学库，然后详细讲述了如何从网上获取和使用一些经典的数据集，如鸢尾花、波士顿房价、糖尿病和手写数字数据集，为初学者提供了实践操作的基础。

摘要由CSDN通过智能技术生成

先导入一些常用的包


import pandas as pd
import numpy as np
import sklearn

从网上下载一些公开的数据，sklearn的一些内置数据集，如鸢尾花数据集、波士顿房价，糖尿病数据集、手写数据集等


from sklearn import datasets
boston = datasets.load_boston()
bostondf = pd.DataFrame(boston.data,columns = boston.feature_names)

在这里插入图片描述

from sklearn import preprocessing
std = preprocessing.StandardScaler()

from sklearn import linear_model
reg = linear_model.linearRegression()

from sklearn import decomposition
dec = decomposition.PCA()

std.get_params()
std.set_params()
std.fit(boston.data)

std.fit(bostondf)
std.mean_
std.scale_

std.transform(bostondf)
std.transform(bostondf[:3])#用的还是std.fit的mean和std
'''
持久化
from sklearn.externals import joblib
joblib.dump(std,path)
joblib.dump(reg,path)
reg2 = joblib.load(path)
'

最低0.47元/天解锁文章

data_bigbing

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习笔记

先导入一些常用的包import pandas as pdimport numpy as npimport sklearn从网上下载一些公开的数据，sklearn的一些内置数据集，如鸢尾花数据集、波士顿房价，糖尿病数据集、手写数据集等from sklearn import datasetsboston = datasets.load_boston()bostondf = pd....
复制链接

扫一扫