2021 年“认证杯”网络挑战赛 B 题(第一阶段)

本文详细介绍了参与2021年“认证杯”网络挑战赛B题的解题思路,主要涉及数据挖掘和聚类分析。作者首先对数据进行预处理,包括数据标准化和统计分析,发现Plx和B-V列具有显著差异。接着,使用机器学习模型填充B-V列的缺失值,通过T检验验证模型效果。进一步,通过DBSCAN聚类方法寻找星群,结合参数筛选确定最佳聚类参数。最终,通过聚类结果找出毕星团,并绘制H-R图进行可视化。
摘要由CSDN通过智能技术生成

本人专挑数据挖掘、机器学习和 NLP 类型的题目做,有兴趣也可以逛逛我的数据挖掘竞赛专栏。

最后,本人不会回访,不互关,不互吹,以及谢绝诸如此类事

赛题官网:http://www.tzmcm.cn/

思路

该题若用数据分析的方法解决,可以看成一个聚类问题。但要对聚类有一个比较深的理解。比如,聚类时,量纲不同,可能导致聚类有偏向性。题目讲:毕星团的 Plx 大于在 [ 20 , 22 ] [20,22]

评论 14
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zhuo木鸟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值