【Dataset】UCI


 


 

【一】 Adult(Classification - 美国人口普查年收入50K分类)

 

简述:针对美国某区域的一次人口普查结果,可以用来预测居民收入是否超过 50K,分为训练集(adult.data)和测试集(adult.test
注意1workclassoccupationnative_country 含有部分 缺失值
注意2:数据存在以下情况: 1.不缺失;2.都缺失;3.只缺失 occupation;4.只缺失 native_country;5.同时缺失 workclassoccupation

 

序号字段名含义类型
0age年龄double
1workclass工作类型string
2fnlwgt序号string
3education教育程度string
4education_num受教育时间double
5maritial_status婚姻状况string
6occupation职业string
7relationship关系string
8race种族string
9sex性别string
10capital_gain资本收益string
11capital_loss资本损失string
12hours_per_week每周工作小时数doule
13native_country原籍string
14(label)income收入string

 

  • 格式
ageworkclassfnlwgteducationeducation_nummaritial_statusoccupationrelationshipracesexcapital_gaincapital_losshours_per_weeknative_countryincome
49Private1601879th5Married-spouse-absentOther-serviceNot-in-familyBlackFemale0016Jamaica<=50K
52Self-emp-not-inc209642HS-grad9Married-civ-spouseExec-managerialHusbandWhiteMale0045United-States>50K

 


 

【二】 Iris(Classification - 鸢尾花分类)

 

简述:鸢尾花数据集共收集了三类鸢尾花,即 Setosa 鸢尾花、Versicolour 鸢尾花和 Virginica 鸢尾花,每一类鸢尾花收集了 50 条样本记录,共计 150 条

 

序号字段名含义类型
0sepal_length萼片长度double
1sepal width萼片宽度double
2petal length瓣片长度double
3petal width瓣片宽度double
4(label)calss类别string

 

  • 格式
萼片长度萼片宽度瓣片长度瓣片宽度类别
5.43.91.70.4Iris-setosa
7.03.24.71.4Iris-versicolor
6.33.36.02.5Iris-virginica

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值