baseline学习笔记
文章平均质量分 94
还重名就过分了啊
混子。
展开
-
【Kaggle】比赛Regression with a Mohs Hardness Dataset-解读PlayGround Series S3 E25 EDA and simple model
先用lgbm在训练集训练,将预测结果作为新的特征合并入数据集,再输入神经网络模型再次训练。搞半天,还数据探索性分析,没怎么预处理,提交结果也并没有他说的0.29,而是0.36,不过他构建的nn模型值得学习。有一说一,图画的很漂亮!!!前段代码可以保存下来,以后直接用。只能说不算浪费时间,有点收获。。。真坑。原创 2023-11-27 11:07:29 · 1033 阅读 · 0 评论 -
AI量化模型预测挑战赛baseline(学习笔记)(一)
首先是认识到了一些语法,以及一些函数的用法,比如groupbyf1_scoresubplotKFoldlistdir。希望在之后的学习中,一点一点熟悉它们,最后能够学以致用,大大提高效率。认识了CatBoost决策树,但是具体原理并不清楚,我打算先学会用再去探索原理。学习了一些特征构造方法。原创 2023-08-09 23:16:45 · 212 阅读 · 1 评论 -
农民身份识别挑战赛baseline(学习笔记)(二)
主要学到了利用pytorch框架构建神经网络模型、定义损失函数、定义优化器的方法,这是我此一次用,比之前自己从神经元开始写起确实方便很多很多。在训练和预测的时候,感觉这里用到的方法和TTA异曲同工,它重复预测三次,每次输入的图像都有一定概率在原图片的基础上进行一些变换,将预测结果相加,最后比较大小以确定最终预测结果。原创 2023-08-09 22:09:50 · 118 阅读 · 1 评论 -
ChatGPT生成文本检测器baseline(学习笔记)(一)
第一次接触这种NLP问题,主要学到了提取的特征的几个类别。原创 2023-08-05 20:09:39 · 211 阅读 · 1 评论 -
农民身份识别挑战赛baseline(学习笔记)(一)
传统提取图像特征的方法在结果上表现并不好,但是仍然可以有启发作用。通过仔细阅读,我学习到了tqdm以及glob库的使用,特别是glob,极大地方便了我后续读取文件的过程。有关注到这种K最邻近算法模型的构建方法,还有训练集的交叉验证过程,都给了我很大的启发。在此之前,我都是numpy和pandas一条龙,效率低而且缺乏严谨性,花费了很多时间效果却很差。我将自己每一次的学习笔记分享出去,方便你,还有我温习。原创 2023-08-05 05:24:39 · 138 阅读 · 1 评论