感想_野营者007的博客-CSDN博客

感想

关注

文章平均质量分 59

关注数：文章数：5 文章阅读量：12573 文章收藏量：6

作者: 野营者007

csdn博客会更偏向于debug错误信息，会详细记录尝试安装软件、第三方库、研究新技术踩过的坑。面试真题栏目只对粉丝开放。题目会包括笔试和面试，会尽可能还原当时的题目。已经开始慢慢搭建自己的笔记体系，更多总结性的文章请移步https://csy99.github.io/Blog

展开

2021个人北美秋招总结

秋招结束后的一些回顾

原创 2021-12-16 08:10:57 · 2267 阅读 · 0 评论
Kfold交叉验证心得

运用Kfold交叉验证时，在一个限度内k的值越大越好。因为k越大我们验证的次数就越多，最后取出来的平均数越能代表训练模型的准确度。但是k是需要在一个限度之内的。k太大有两个坏处。1. 容易给机器造成过重负担，花费大量时间。2. 每一次验证的测试集（或验证集）中数据太少，很难得到准确的误报率。总体而言，k一般取10，取值依不同项目情况而定，当然一定存在k<n（训练集数据条数）。...

原创 2019-01-18 15:59:36 · 9230 阅读 · 0 评论
Kaggle心得（二）

House Prices: Advanced Regression Techniques1. 了解模型的好坏第一遍提交的时候，只是单纯比较了线性回归模型和随机森林模型对验证集的mean square error。压根就没计算模型对于训练集的mean square error。这样其实是很不负责任的。我根本没办法知道模型是under-fit还是over-fit。2. 多浏览大牛的博客...

原创 2019-04-22 06:22:27 · 167 阅读 · 0 评论
Kaggle心得（一）

Titanic1. 不要痴迷于使用复杂的模型，有时候使用简单模型效果更佳。经过数据预处理和数据清洗之后，使用随机森林和逻辑回归两种模型。随机森林模型对象使用网格搜索进行十折验证进行调参。两个模型对象的准确率： logr rf_grid 训练集 84.11% 89.09% 验证集 79.85% 78.36% 测试集 78....

原创 2019-02-04 05:19:56 · 269 阅读 · 0 评论
随笔：项目感想、知识总结、未来展望

假期差不多结束了，在这里稍微做一点总结。项目在MSKCC帮着做一个生物相关方向的项目，也是一次正经学术研究的尝试。不过因为自己对生物前沿研究不是特别了解，缺乏一些必要的领域知识，所以没办法起到主导作用。基本上都是带我的mentor（phD学生）跟我布置一下工作，我做一点。如果我遇到了什么技术上的问题或者方向上的问题，就只能停下来，等着她给答复。感觉自己摸鱼严重^ v ^。之前也是觉得Computational Biology这个领域非常热门，发展前景不错，尝试了解一下。不过现在觉得之后还是得做自己领域

原创 2020-08-19 04:33:09 · 641 阅读 · 0 评论

感想

作者: 野营者007

2021个人北美秋招总结

Kfold交叉验证心得

Kaggle心得（二）

Kaggle心得（一）

随笔：项目感想、知识总结、未来展望