2021年美赛C题思路--个人想法

分析题目,但是仅代表个人想法,后期特等奖出来后会对自己的想法进行纠正分析。
关键:如何解释公众报告提供的数据?
采用什么策略来优先考虑这些公众报告?

在回答所有问题前需要先对数据进行分析处理,并且对图像集进行分析分类。

问题一:预测大黄蜂随时间的传播,并分析准确度如何?

思路:分析随时间的变化其位置发生的改变(数据表中的经纬度)—求得的结果与“宾夕法尼亚州立大学”提供的资料对比

问题二:使用数据集+图像文件创建一个错误分类成胡蜂的模型

(1)先收集胡蜂的描述性特征(“宾夕法尼亚州立大学”提供的FDF文件+网络查找材料+图像文件的特征提取)
(2)使用数据集data里的“notes”与“Lab status”确定是都被错误分类。(即没有胡蜂特征的globalID与notes是否被分类成status里的positiveID)

问题三:使用第二问的模型讨论如何优先调查最有可能是正面目击的报告。

查看数据data-lab comments中的关键信息,进行文本分析,根据第2问得出错误分类有哪些?再再这些分类中查看lab comments信息。

问题四:如何更新“错误分类模型”及更新的频率?(随时间变化)

这一问主要是想对“错误分类”模型进行灵敏度分析,加入一些影响因子看变化即可。

问题五:使用模型来证明已经消灭了这个害虫?

分析lab status中negativeID占比,以及随着时间的推移,comments中的文本描述中出现有关这种害虫的关键词出现概率占比较小或者趋于0.

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值