机器学习Tips(待补充)

最新推荐文章于 2022-07-07 16:12:52 发布

Young_Birds

最新推荐文章于 2022-07-07 16:12:52 发布

阅读量344

点赞数

分类专栏：笔记文章标签：机器学习神经网络随机森林梯度下降线性回归

本文链接：https://blog.csdn.net/Young_Birds/article/details/45972895

版权

笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Tips

一、样本

1.控制样本数

原因：所有样本一起输入，慢且不准：模型复杂时，样本数不足，导致variance不好

方法：随机打散样本 e.g.10000个样本=>100一组，跑完一次全部样本=1个epoch，每6-8个epoch学习率*0.9

2.令样本期望=0，加快收敛

方法：每个样本 - 样本均值

二、各参数初始化

1.学习率α

α = 0.001~0.01

2.正则化参数λ

λ < 1, 在保持效果的前提下，选用大的λ ，可防止过拟合

3.根据loss修改参数

目标：loss随迭代而变小

注：正则化后，loss一定会变大

A.loss不变

a.α过小

b.λ 过大

B.loss抖动

α过大

C.NaN数据溢出错误

a.初始化选用样本时，方差过大。e.g.选择高斯分布

b.α过大

三、不同机器学习方法Tips

1.神经网络

e.g.1个隐含层(100个隐含节点)

if 多层 then 易过拟合（注：神经网络不可避免过拟合，只需保证在一定限度内控制过拟合即可）

注：消除过拟合方法：a. λ *(参数)^2 b.每次置若干个隐含节点=0

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Young_Birds

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

机器学习算法与Python实践之（四）支持向量机（SVM）实现(源码)

wenyusuran的专栏

05-14

1万+

机器学习算法与Python实践这个系列主要是参考《机器学习实战》这本书。因为自己想学习Python，然后也想对一些机器学习算法加深下了解，所以就想通过Python来实现几个比较常用的机器学习算法。恰好遇见这本同样定位的书籍，所以就参考这本书的过程来学习了。在这一节我们主要是对支持向量机进行系统的回顾，以及通过Python来实现。由于内容很多，所以这里分成三篇博文。第一篇讲SVM初

hive+hbase学习手册

尬聊码农

05-13

820

hive学习手册一、hive入门手册 1.什么是数据仓库 1.1数据仓库概念对历史数据变化的统计，从而支撑企业的决策。比如：某个商品最近一个月的销量，预判下个月应该销售多少，从而补充多少货源。 1.2传统数据仓库面临的挑战（1）无法满足快速增长的海量数据存储需求（2）无法有效处理不同类型的数据（3）计算和处理能力不足 1.3 Hive介绍 Hbase支持快速的交互式的大数据应用 ...

参与评论您还未登录，请先登录后发表或查看评论

机器学习小的tips

appleaoliao的博客

07-31

414

1. 使用 ADAM优化器。和批量梯度下降等传统优化器相比，Adam优化器效果更好。 2. Relu是最好的非线性映射（激活函数）。就像 Sublime是最好的文本编辑器， ReLU快速、简单，神奇的地方在于它在训练过程中不会逐渐减少梯度。虽然教科书中常用sigmoid作为激活函数，但是它在DNN中不能很好地传递梯度。 3. 使用方差缩放初始化（variance-scaled init...

机器学习小tip

火腿烧豆腐的博客

03-17

228

偏差与方差模型的偏差，指的是模型预测的期望值与真实值之间的差；模型的方差，指的是模型预测的期望值与预测值之间的差平方和；偏差用于描述模型的拟合能力；方差用于描述模型的稳定性。什么叫支持向量训练数据集中与分离超平面距离最近的样本点的实例称为支持向量更通俗的解释：数据集种的某些点，位置比较特殊。比如 x+y-2=0 这条直线，假设出现在直线上方的样本记为 A 类，下方的记为 B 类。 ...

Deep Learning中的一些Tips详解（RELU+Maxout+Adam+Dropout）

热门推荐

KI的博客

07-11

8万+

本文主要讲如果我们的Deep Learning出现了一些不好的结果，我们该怎么去解决。学习前请先参考：反向传播算法(Backpropagation)----Gradient Descent的推导过程。

深度神经网络为何很难训练(译文)

深藏功与名

01-09

3852

原文假设你是一名工程师，接到一项从头开始设计计算机的任务。某天，你在工作室工作，设计逻辑电路，构建 AND 门，OR 门等等时，老板带着坏消息进来：客户刚刚添加了一个奇特的设计需求：整个计算机的线路的深度必须只有两层：两层线路你惊呆了，跟老板说道：“这货疯掉了吧！” 老板说：“他们确实疯了，但是客户的需求比天大，我们要满足它。” 实际上，在某种程度上看，他们的客户并没有

机器学习-coursera-exercise4-神经网络

coder

02-25

1137

一、神经网络-手写数字的识别（1）可视化数据跟前面一次练习题的可视化数据的函数一样，代码不贴了，同exercise3-可视化数据跟之前一样将每一个样例（20pixel*20pixel）的灰度图像展开成一个向量（400维），这样得到的X矩阵包含m（m=5000）行，每一行是一个样例。 y是一个5000维的向量。（2）模型表示 神经网络存在三层，一个输入层，一个隐藏层（25

机器学习 DAY4

weixin_44233202的博客

03-06

198

普适逼近定理

机器学习 day1

weixin_44233202的博客

02-14

261

书籍链接：http://tangshusen.me/Dive-into-DL-PyTorch/#/ 一、线性回归 对于「线性模型」的内容，那我们就来看看「西瓜书」「统计学习方法」「ESL」「PRML」这几本书大概是怎么来讲解这部分内容的。（1）「西瓜书」「西瓜书」在第三章中展开了对「线性模型」的讨论，首先是介绍了线性模型「基本形式」，无论是线性回归还是线性分类，都是基于这个基本的线性模型的形式...

100天搞定机器学习（100-Days-Of-ML）（一）数据预处理

徐先森的博客

11-17

1125

这是github一个开源项目，作者是Avik Jain，内容是从机器学习的基础概念起步，逐层递进，很适合初学者。github地址是https://github.com/Avik-Jain/100-Days-Of-ML-Code。截至到现在，已经有近16000多的star。为了学习ML的实战技巧，跟着这个开源项目学习了一段时间，并贡献了一点issues。现在将自己的学习过程总结起来，仅供以后参考...

脑科学磁共振成像（MRI)初学者必看——功能脑网络、小世界网络、FDR校正、脑电信号频率变换、模板、假设检验、广义线性模型、独立成分分析、影像组学、任务态和静息态方法汇总

从事脑科学核磁共振方法学研究，在Nature communications等权威期刊发表研究论文，熟练掌握磁共振处理方法和统计学方法，欢迎大家和我交流。

04-17

2万+

磁共振成像初学者必看一、浅谈功能脑网络二、不同模态脑网络的构建功能脑网络结构脑网络白质纤维束脑网络加权网络二值网络三、趣谈散点图与相关系数四、脑电信号频域变换五、fMRI中的FDR校正六、模板（mask）1、模板(mask )往往是与ROI联系在一起的2、mask作用的原理3、常见的mask七、假设检验和效果量八、组水平标准化九、由 ALFF 说开去十、计算机存取MRI影像的那些事十二、Linux基础命令十三、浅谈标准空间模板和空间变换一：标准空间模板二：空间变换十四、功能连接十五、大脑激活与功能连接的

源1.0预训练语言模型使用示例

飞翔的大鱼

07-07

2368

源1.0预训练语言模型（简称源1.0）是浪潮人工智能研究院发布的人工智能巨量模型，单体模型参数量达到2457亿，成为全球最大规模的中文语料AI巨量模型。作为通用NLP预训练模型，源1.0能够适应多种类的AI任务需求，降低针对不同应用场景的语言模型适配难度，并提升小样本学习与零样本学习场景的模型泛化应用能力。调用源1.0API接口，使用源1.0的推理能力，可以支持下游几十个不同应用场景的任务。调用源1.0API接口有两种方式，可以直接使用代码调用，也可以使用源提供的图形化工具APIExp进行调用。...

机器学习-52-RL-04-Tips of Q-Learning(强化学习-Q学习的一些技巧:Double DQN&Dueling DQN&Prioritized Reply&Multi-step等)

迷雾总会解

01-23

1280

本片文章要讲的是训练 Q-learning 的一些 tips：Double DQN，Dueling DQN，Prioritized Reply，Multi-step(Balance between MC and TD)，Noisy Net(on Action vs on Q-function)，Distributional Q-function，Rainbow

转发：经典面试题

weixin_30362083的博客

05-26

113

转发：http://www.jianshu.com/p/c22886db98ec 什么是响应链，它是怎么工作的？这个问题笔者写过一篇博客,里面有对这个问题的详细解释如何访问并修改一个类的私有属性？有两种方法可以访问私有属性,一种是通过KVC获取,一种是通过runtime访问并修改私有属性创建一个Father类,声明一个私有属性name,并重写description打印n...

10-4讲题

weixin_33943836的博客

10-04

122

今天没讲什么题，主要是扯扯蛋之类的。比较有意思的应该是第一类以及第二类指数同余方程求A^x=B (mod C) 的根首先据ryz大佬说没有什么数学方法可以解决，但有一种对C的分块的暴力枚举。取m=sqrt(C); 则设x=i*m+j; 所以A^(i*m+j)=B ==> A^(i*m)=B*A^(-j) 所以一边暴力枚举再在另一边查询即可可以看看这篇bloghtt...

8-4讲题

weixin_33719619的博客

08-04

109

讲了这么几道题鸡蛋的硬度DNA——POJ2520括号染色按钮数轴上有N个按钮，第i个按钮按下去后过ti时间会弹起来，走1路程需要1时间，求怎么按可以将所有按钮按下去。N<=1000 COJ3541不要62 在一个正整数中，如果包含4或62则不吉利，求[a,b]内所有吉利的正整数个数beautiful numbers如果一个整数能被它所有的非0整数位整除，则称它是漂亮的，求[a,b]中有...

转发：机器学习面试题-------待补充

NockinOnHeavensDoor的博客

05-15

220

2、讲讲DBN模型。 3、你的模型如果用CNN模型如何？ 4、损失函数如何去选择？ 5、出了sigmoid函数还了解哪些？ 6、现在的深度网络相比于以前(大概30年前)的神经网络有了哪些改进？ 7、神经网络有哪些优化算法？ 8、概率论：均匀分布如何转变为高斯分布？ 9、如何理解白噪声？图像的白噪声是如何形成的？ 10、过拟合与欠拟合的问题。 11、用过哪些深度学习平台？ 12、...

网络模型(待补充)

Libra_Ng

02-10

323

Innternet protocol stack application transport network network link physical ????Application supporting network applications:FTP,SMTP,HTTP ????Transport process-process data transfer:TCP,U...

网易面试总结

竭尽全力的专栏

09-13

3237

之前投过了网易内推，笔试过了，但是一直没通知我面试。我当时想着可能没戏了吧，毕竟笔试成绩不是特别高。今天突然接到网易说要面试的电话，感觉还是很意外的。当然也没怎么准备，想到什么就说什么了。 1、讲讲项目。 2、讲讲DBN模型。 3、你的模型如果用CNN模型如何？ 4、损失函数如何去选择？ 5、出了sigmoid函数还了解哪些？ 6、现在的深度网络相比于以前(大概30年前)的神经网络有了

机器学习基础与知名算法详解

"这是一份由Jim Liang编写的机器学习笔记，内容详尽且完整，主要涵盖机器学习的基础概念、知名算法以及其他专题。笔记使用Python作为编程语言，并适合对机器学习感兴趣的读者学习。" 这篇机器学习笔记首先介绍了...