sklearn-加载数据

最新推荐文章于 2024-07-16 17:02:33 发布

不ZA懂

最新推荐文章于 2024-07-16 17:02:33 发布

阅读量7.2k

点赞数 2

分类专栏： sklearn 文章标签：机器学习

本文链接：https://blog.csdn.net/preapy/article/details/73549127

版权

本文介绍了如何使用scikit-learn加载数据，包括从网络数据仓库如UCI机器学习库获取数据，以及加载本地CSV文件。同时，还讨论了如何使用NumPy的loadtxt方法和savetxt方法进行数据的保存。

摘要由CSDN通过智能技术生成

加载数据

一般输入的数据是一个矩阵或CSV文件；
将数据加载到内存中；
可以是网络上的数据，比方说UCI机器学习数据仓库也可以是保存在本地的文件。

网络数据仓库

scikit-learn的实现使用了NumPy中的arrays，所以，我们要使用NumPy来载入csv文件。
以下是从UCI机器学习数据仓库中下载的数据。

import numpy as np 
import urllib 
# url with dataset 
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data" 
# download the file 下载文件
raw_data = urllib.request.urlopen(url) 
# load the CSV file as a numpy matrix 
dataset = np.loadtxt(raw_data, delimiter=",") 
# separate the data from the target attributes 
X =