机器学习练习数据来源

本文介绍了在机器学习实践中获取数据集的途径,重点提到了sklearn、seaborn和altair这三个库。它们各自提供了内置的数据集,方便学习者用于练习和示例。例如,sklearn库通过`sklearn.datasets.load_...`函数,seaborn库和altair包也提供了相应的方法获取数据。
摘要由CSDN通过智能技术生成

我在github 上建了个repo DataSetForMachineLearning,用来存放各种数据集,如果有需要,欢迎star

进行机器学习时,有时候需要一些数据做练手,数据从何而来呢,可以充分利用一些库,像sklearnseaborn 都是自带一些数据的(如常见的iris花卉,titanic泰坦尼克号数据。。。),可以通过如下方式获取:

sklearn


In [80]: from sklearn import datasets

In [81]: list(filter(lambda x: 'load' in x, dir(datasets)))
Out[81]: 
['__loader__',
 'load_boston',
 'load_breast_cancer',
 'load_diabetes',
 'load_digits',
 'load_files',
 'load_iris',
 'load_linnerud',
 'load_mlcomp',
 'load_sample_image',
 'load_sample_images',
 'load_svmlight_file',
 'load_svmlight_files',
 'load_wine']

使用方法如下:


In [90]: wine = datasets.load_wine()

In [91]: wine.data.shape
Out[91]: (178, 13)

In [92]: wine.data[:10]
Out[92]: 
array([[  1.42300000e+01,   1.71000000e+00,   2.43000000e+00, ...,
          1.04000000e+00,   3.92000000e+00,   1.06500000e+03],
       [  1.32000000e+01,   1.78000000e+00,   2.14000000e+00, ...,
          1.05000000e+00,   3.40000000e+00,   1.05000000e+03],
       [  1.31600000e+01,   2.36000000e+00,   2.67000000e+00, ...,
          1.03000000e+00,   3.17000000e+00,   1.18500000e+03],
       ..., 
       [  1.40600000e+01,   2.15000000e+00,   2.61000000e+00, ...,
          1.06000000e+00,   3.58000000e+00,   1.29500000e+03],
       [  1.48300000e+01,   1.64000000e+00,   2.17000000e+00, ...,
          1.08000000e+00,   2.85000000e+00,   1.04500000e+03],
       [  1.38600000e+01,   1.35000000e+00,   2.27000000e+00, ...,
          1.01000000e+00,   3.55000000e+00,   1.04500000e+03]])

In [94]: wine.keys()
Out[94]: dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])

In [95]: wine.feature_names
Out[95]: 
['alcohol',
 'malic_acid',
 'ash',
 'alcalinity_of_ash',
 'magnesium',
 'total_phenols',
 'flavanoids',
 'nonflavanoid_phenols',
 'proanthocyanins',
 'color_intensity',
 'hue',
 'od280/od315_of_diluted_wines',
 'proline']

seaborn

In [96]: import seaborn as sns

In [
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值