二维机器学习测试数据生成

最近在看mlapp的第七八章,讲的是线性回归和逻辑回归的内容

当然就难免写点代码来进行实验,总喜欢自己做一些数据而不只是写一个原函数再加上噪声

毕竟自己点点点出来然后得到学习的直线比较有feel,所有就需要这样一个东西:

一个坐标系上点点点出一些点,然后自动生成点的数据放在程序里来跑

估计是东西太小,都没看人做个,纠结一番还是自己动手做了一个

【【【【【【【【地址在此,请用支持html5的浏览器打开】】】】】】】】

我学javascript和html也比较浅,反正各种参考最后是搞出来了

大概的界面就是下面这个样子,可以输入宽和高调节坐标系的大小

(负数就没搞出来了,反正是学习用的)


生成数据按钮在下面的文本框里得到数据,可以选择是否在每个样例前添加一个常数1(具体啥用知道的都知道)

可以选择regression(X内容是x的坐标,y的内容是点的y轴的坐标值)

      或者logistic模式(X的内容是点的完整坐标,y的内容是点的标号)

默认是regression模式的

生成的数据可以直接放在python里面跑,比如:


生成的数据放在python里的fit出来的结果就是:(下面的横轴坐标不均匀,所以看起来有点变形,其实没有)


而上图生成的logistic样例就是下面这样,这样就不用苦逼地自己去编数据了,点点几下东西就出来了^_^

X=[
[1,1.7611110925674438,3.6876739501953124],
[1,2.7111110925674438,5.637673950195312],
[1,4.311111092567444,6.2876739501953125],
[1,3.4611110925674438,4.087673950195312],
[1,5.261111092567444,5.5376739501953125],
[1,6.4111110925674435,6.437673950195313],
[1,6.6611110925674435,3.7376739501953127],
[1,3.811111092567444,2.2876739501953125],
[1,2.9611110925674438,2.2376739501953127],
[1,4.961111092567444,3.9876739501953127],
[1,5.861111092567444,12.337673950195313],
[1,6.861111092567444,14.137673950195312],
[1,7.111111092567444,12.637673950195312],
[1,8.311111092567444,10.837673950195313],
[1,9.211111092567444,11.537673950195312],
[1,8.861111092567445,14.237673950195312],
[1,9.911111092567443,14.137673950195312],
[1,9.111111092567445,13.537673950195312],
[1,10.161111092567443,11.987673950195312],
[1,11.011111092567443,11.687673950195313],
[1,13.011111092567443,6.087673950195312],
[1,13.711111092567444,8.137673950195312],
[1,15.161111092567443,7.0376739501953125],
[1,15.461111092567444,5.137673950195312],
[1,15.811111092567444,2.7376739501953127],
[1,13.761111092567443,3.9876739501953127],
[1,14.511111092567443,5.837673950195312],
[1,16.261111092567443,8.337673950195313],
[1,16.611111092567445,6.487673950195313],
[1,17.461111092567442,4.187673950195313],
[1,18.011111092567443,8.037673950195312],
[1,18.361111092567445,9.787673950195312],
[1,18.611111092567445,10.037673950195312]]


y=[
[0],
[0],
[0],
[0],
[0],
[0],
[0],
[0],
[0],
[0],
[2],
[2],
[2],
[2],
[2],
[2],
[2],
[2],
[2],
[2],
[1],
[1],
[1],
[1],
[1],
[1],
[1],
[1],
[1],
[1],
[1],
[1],
[1]]

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
二维人工数据集是指由人工生成二维数据集,其目的是用于模式识别和机器学习算法的测试和验证。这种数据集通常由人工设置的特征和标签组成,使研究人员能够针对特定问题设计和评估算法。 与之相对的是 UCI 真实数据集,它是指由 UCI Machine Learning Repository(UCI机器学习库)提供的真实世界数据集。这些数据集收集并整理了各种领域的真实数据,包括医疗、金融、社交网络等等,并且这些数据集已经经过了匿名化处理以保护数据隐私。 二维人工数据集与 UCI 真实数据集在数据来源、生成方式和用途方面存在差异。二维人工数据集是由人工生成的,主要用于验证和比较算法的性能。由于数据是人工设定的,研究人员可以控制数据的分布、相关性等特性。这种数据集常常被用来构建简单的模型和进行初步的算法调试。 而 UCI 真实数据集则是通过真实领域的数据采集获得的,具有更广泛的应用背景和更真实的特征。这些数据集对于研究人员、学生和数据科学家来说非常有价值,可以用来研究真实世界中的问题,并开发出适用于实际应用的算法和模型。 总的来说,二维人工数据集和 UCI 真实数据集在研究和实践中都具有重要的作用。二维人工数据集适用于初步的算法验证和性能比较,而 UCI 真实数据集则更适合于真实世界问题的研究和应用。研究人员可以根据具体的需求选择适合的数据集来进行相关工作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值