![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
感想
文章平均质量分 59
野营者007
csdn博客会更偏向于debug错误信息,会详细记录尝试安装软件、第三方库、研究新技术踩过的坑。
面试真题栏目只对粉丝开放。题目会包括笔试和面试,会尽可能还原当时的题目。
已经开始慢慢搭建自己的笔记体系,更多总结性的文章请移步https://csy99.github.io/Blog
展开
-
2021个人北美秋招总结
秋招结束后的一些回顾原创 2021-12-16 08:10:57 · 2267 阅读 · 0 评论 -
Kfold交叉验证心得
运用Kfold交叉验证时,在一个限度内k的值越大越好。因为k越大我们验证的次数就越多,最后取出来的平均数越能代表训练模型的准确度。但是k是需要在一个限度之内的。k太大有两个坏处。1. 容易给机器造成过重负担,花费大量时间。2. 每一次验证的测试集(或验证集)中数据太少,很难得到准确的误报率。总体而言,k一般取10,取值依不同项目情况而定,当然一定存在k<n(训练集数据条数)。...原创 2019-01-18 15:59:36 · 9230 阅读 · 0 评论 -
Kaggle心得(二)
House Prices: Advanced Regression Techniques1. 了解模型的好坏第一遍提交的时候,只是单纯比较了线性回归模型和随机森林模型对验证集的mean square error。压根就没计算模型对于训练集的mean square error。这样其实是很不负责任的。我根本没办法知道模型是under-fit还是over-fit。2. 多浏览大牛的博客...原创 2019-04-22 06:22:27 · 167 阅读 · 0 评论 -
Kaggle心得(一)
Titanic1. 不要痴迷于使用复杂的模型,有时候使用简单模型效果更佳。经过数据预处理和数据清洗之后,使用随机森林和逻辑回归两种模型。随机森林模型对象使用网格搜索进行十折验证进行调参。两个模型对象的准确率: logr rf_grid 训练集 84.11% 89.09% 验证集 79.85% 78.36% 测试集 78....原创 2019-02-04 05:19:56 · 269 阅读 · 0 评论 -
随笔:项目感想、知识总结、未来展望
假期差不多结束了,在这里稍微做一点总结。项目在MSKCC帮着做一个生物相关方向的项目,也是一次正经学术研究的尝试。不过因为自己对生物前沿研究不是特别了解,缺乏一些必要的领域知识,所以没办法起到主导作用。基本上都是带我的mentor(phD学生)跟我布置一下工作,我做一点。如果我遇到了什么技术上的问题或者方向上的问题,就只能停下来,等着她给答复。感觉自己摸鱼严重^ v ^。之前也是觉得Computational Biology这个领域非常热门,发展前景不错,尝试了解一下。不过现在觉得之后还是得做自己领域原创 2020-08-19 04:33:09 · 641 阅读 · 0 评论