实习
文章平均质量分 69
FigthingForADream
这个作者很懒,什么都没留下…
展开
-
欠拟合,过拟合和正则化
整理的关键点欠拟合:模型过于简单,不能很好的描述数据的趋势,导致在训练集误差也很大1、添加特征量,可能选取的特征不能完全的表示数据的趋势2、添加多项式特征,这个在机器学习算法里面用的很普遍,例如将线性模型通过添加二次项或者三次项使模型泛化能力更强3、减小惩罚项,减少L1,L2正则化参数所谓的过拟合就是模型在训练集误差较小,而在测试集却出现较大误差,可能是模型过于复杂导致的1、可以多增加训练集样本量...原创 2018-04-09 16:52:25 · 445 阅读 · 0 评论 -
对于正负样本不均衡的解决方法
1、最好的办法是获得更多的数据2、换个评价标准,有一些评判指标就是专门解决样本不平衡时的评判问题的,如准确率,召回率,F1值3、重新采样,少的重复采样,多的抽样,或者加入惩罚权重,多的权重小,少的权重大,这就跟梯度提升类似吧梯度提升AdaBoost会把误分类样本加大权重,在表决中其较大作用4、换个对数据平衡性要求不那么大的机器学习算法,例如决策树5、修改算法。。。合成样本增加样本数目较少的那一类的...原创 2018-04-09 16:54:22 · 5569 阅读 · 0 评论 -
不得不提的LR和SVM
发现很多算法,机器学习,深度学习面经中经常会提到一个问题,LR和SVM的比较,也稍微整理了以下首先是两者的共同点:1,LR和SVM都是分类算法2,如果不考虑核函数,LR和SVM都是线性分类算法,即分类决策面都是线性的3,LR和SVM都是有监督学习算法4,LR和SVM都是判别模型模型作为统计学习的三要素之一(模型,策略,算法)模型:学习什么样的模型,模型就是所要学习的条件概率分布或者说是决策函数,p...原创 2018-04-09 17:18:41 · 531 阅读 · 0 评论 -
深度学习在自然语言处理中的应用
综述的大体部分自然语言处理的基础研究主要包括词法分析、句法分析、语义分析、语用语境与篇章分析等的研究。词向量(Word embedding 或Word representation) 方法,可以将词映射转换到一个独立的向量空间自然语言处理技术中采用深度学习知识的原因可以总结为以下几点:1、自然语言处理任务中首先要解决的问题是处理对象的表示形式,为了表示对象,通常必须抽取一些特征,如文本的处理中,常...原创 2018-04-09 17:20:45 · 1206 阅读 · 0 评论 -
牛客选择题(一)
-----------------------------------------------牛客700题整理------------------------------------------------1、不稳定排序算法有:快些(希)选对(堆)2、外部排序过程中,为了减少外存读写次数需要减少归并趟数,可以让初始归并段的长度增减,从而减小初始归并段的段数3、对于某个元素,如果其后存在一个元素小于...原创 2018-06-03 16:47:32 · 1048 阅读 · 0 评论 -
牛客选择题(二)
牛客700题整理(二)1、两层for循环次数不一样的时候(差很多的时候,比如1000次和1000000次),速度不一样快,并不是简单的时间复杂度问题 进行数组访问时,操作系统需要将相关内存页面载入cache中,一个页面的大小是有限的,如果程序需要访问页面外的内存数据,操作系统需要进行换页操作,这个操作是耗时的。t1访问的内存区域大小为1000,系统不需要或极少需要换页。t2需要访问的内存区域大小为...原创 2018-06-03 16:51:48 · 457 阅读 · 0 评论