2024年“华数杯”C题【完整思路+解题代码+模型结果+参考文章】

本文包含2024年“华数杯”C 题 老外游中国 完整解题过程、思路、代码。

问题1:请问 352 个城市中所有 35200 个景点评分的最高分(Best Score,简称 BS)是多少?全国有多少个景点获评了这个最高评分(BS)?获评了这个最高评分(BS)景点最多的城市有哪些?依据拥有最高评分(BS)景点数量的多少排序,列出前 10 个城市。为了回答这个问题,我们需要处理一系列步骤,包括数据读取、数据分析、计算最高评分(BS),以及统计和排序城市。

  1. 数据准备

  2. 解题步骤

  3. 读取所有城市的景点评分数据
    我们需要将所有城市的 CSV 文件合并到一个 DataFrame 中。

  4. 计算最高评分(BS)
    从合并后的 DataFrame 中找出所有景点评分的最高分。

  5. 统计获得最高评分的景点数量
    统计每个城市中获得最高评分的景点数量,并找出这些城市中获得最多的前 10 个城市。

import pandas as pd
import glob
file_paths 
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
2021华数杯是一项以数据科学为主的比赛,其中2021b是其中一道考。2021b主要涉及到数据分析和机器学习的应用。 在这道目中,我们被给出了一个包含大量银行借贷交易数据的数据集。目要求我们根据这些数据,建立一个预测模型来判断借款人是否存在信用风险。 首先,我们需要对数据进行探索性数据分析。这包括查看数据的基本统计特征,如均值、中位数、标准差等。我们还可以通过绘制直方图和箱线图来了解数据的分布和异常值情况。通过这些分析,我们可以对数据有一个初步的认识。 接下来,我们需要进行特征工程,即对原始数据进行处理和转换,以得到更有意义的特征。例如,可以从交易金额中提取出每笔交易的平均值和方差作为新特征,以反映借款人的消费习惯。还可以考虑使用独热编码将某些分类特征转换为连续特征。 然后,我们可以选择适当的机器学习算法来建立预测模型。常见的算法包括逻辑回归、决策树、随机森林和支持向量机等。我们可以使用交叉验证来评估模型的性能,并进行参数调优来提高模型的准确性和泛化能力。 最后,我们可以使用训练好的模型对测试集进行预测,并生成预测结果。可以使用评价指标如准确率、精确率、召回率和F1分数来评估模型的表现。 总之,2021华数杯2021b涉及到数据分析和机器学习的应用。通过对数据的探索和特征工程,选择适当的算法建立预测模型,并对模型进行评估和优化,我们可以有效地预测借款人是否存在信用风险。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值