- 博客(22)
- 收藏
- 关注
原创 基于机器学习的城市暴雨量预测
本次研究数据集主要来自于美国气象学会人工智能委员会在2014举办的How Much Did it Rain Ⅱ的竞赛。竞赛主要聚焦于解决降雨量预测的问题,以此推进气象领域的相关研究。降雨量在空间和时间上变化很大,因此很难测量。雨量计可以成为特定位置的有效测量工具,但不可能无处不在。为了覆盖广泛,天气雷达的数据被用来估计全国的降雨量。不幸的是,这些预测与使用雨量计进行的测量结果并不完全吻合。
2023-03-18 10:22:26
1250
原创 DataWhale数据分析第三章模型建立和评估--评价
根据之前的模型的建模,我们知道如何运用sklearn这个库来完成建模,以及我们知道了的数据集的划分等等操作。两个ROC曲线相交—>利用ROC曲线下的面积(AUC,areaunderROCcurve,是一个数值)进行比较学习器的效果。复制来的k折越多,平均误差被视为泛化误差这个结果就越可靠,但相应的所花费的时间也是线性增长的。【思考】什么是二分类问题的混淆矩阵,理解这个概念,知道它主要是运算到什么任务中的。【思考】什么是ROC曲线,OCR曲线的存在是为了解决什么问题?这些信息可以做什么?...
2022-07-21 21:31:38
183
原创 DataWhale数据分析第三章模型建立和评估--建模
经过前面的两章的知识点的学习,我可以对数数据的本身进行处理,比如数据本身的增删查补,还可以做必要的清洗工作。这一章我们要做的就是使用数据,我们做数据分析的目的也就是,运用我们的数据以及结合我的业务来得到某些我们需要知道的结果。我们从这个模型的到结果之后,我们要分析我的模型是不是足够的可靠,那我就需要评估这个模型。我们这里使用一个机器学习最常用的一个库(sklearn)来完成我们的模型的搭建。我们拥有的泰坦尼克号的数据集,那么我们这次的目的就是,完成泰坦尼克号存活预测这个任务。这里使用留出法划分数据集。...
2022-07-21 21:27:32
187
原创 DataWhale数据分析第二章第四节:数据可视化课程
主要给大家介绍一下Python数据可视化库Matplotlib,在本章学习中,你也许会觉得数据很有趣。在打比赛的过程中,数据可视化可以让我们更好的看到每一个关键步骤的结果如何,可以用来优化方案,是一个很有用的技巧。...
2022-07-18 22:12:04
159
原创 解决方案|AttributeError: (module ‘scipy.sparse‘ has no attribute ‘coo_array‘)
AttributeError: (module ‘scipy.sparse‘ has no attribute ‘coo_array‘);Networkx;Scipy
2022-07-04 08:36:02
4332
原创 解决方案|pyltp RuntimeError: incompatible native format - size of long(For Mac OS)
pyltp RuntimeError: incompatible native format - size of long
2022-06-21 08:48:19
403
原创 解决方案|ValueError:The following settings are not supported :{‘username‘: ‘neo4j“}
Neo4j最新版使用示例
2022-06-14 08:37:12
2029
原创 PyTorch深度学习(B站刘二大爷)第九讲作业 Otto Group Product Classification
PyTorch深度学习(B站刘二大爷)第九讲 Otto Group Classification
2022-06-07 11:32:19
371
3
原创 PyTorch深度学习(B站刘二大爷)第八讲作业——Kaggle网站泰坦尼克号Titanic
PyTorch深度学习(B站刘二大爷)第八讲作业——Kaggle网站泰坦尼克号Titanic
2022-05-31 15:52:25
947
3
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人