自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (3)
  • 收藏
  • 关注

转载 过拟合问题:正则化(转)

转载原文正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining时,常常会导致overfitting(过拟合)。其直观的表现如下图所示,随着训练过程的进行,模型复杂度增加,在training data上的error渐渐减小,但是在验证集上的error却反而渐渐增大——因为训练出来的网络过拟合了训练集,对训练集外的数据却不work。为了防止overfitting,可以用的...

2018-05-21 10:40:43 231

转载 决策树学习概述

转载链接转载的一篇关于决策树的知识,感觉这篇比较容易理解。脑子太笨了。。基于树的学习算法在数据科学竞赛中相当常见。这些算法给预测模型赋予了准确性、稳定性以及易解释性。其中,决策树算法也是引人关注的「随机森林」算法的基础构造模块。本文介绍了决策树的概念和简单实现,使用生动的示例帮助理解,希望能够对你有所帮助。对于 ML 的入门者来说,决策树很容易上手。本教程将介绍:决策树是什么如何构建决策树使用 P...

2018-05-16 11:09:22 497

原创 python多线程和多进程总结

 python多线程: 多线程的理解:多进程和多线程都可以执行多个任务,线程是进程的一部分。线程的特点是线程之间可以共享内存和变量,资源消耗少(不过再Unix环境中,多进程和多线程资源调度消耗差距不明显,Unix调度较快),缺点是线程之间的同步和加锁比较麻烦。           线程是操作系统能够进行运算调度的最小单位。它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序...

2018-05-16 10:32:46 2448

转载 为什么在Python里推荐使用多进程而不是多线程?

转载链接最近在看Python的多线程,经常我们会听到老手说:“Python下多线程是鸡肋,推荐使用多进程!”,但是为什么这么说呢?                要知其然,更要知其所以然。所以有了下面的深入研究:                首先强调背景:        1、GIL是什么?GIL的全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考...

2018-05-16 10:28:20 90

LSTM情感分析数据集.zip

里面包含nlp情感分析训练测试时所使用的数据集(正例,负例),以及词向量文件。

2019-09-06

调参手册-一个框架解决几乎所有机器学习问题.pdf

该文档描述了机器学习工程常规流程,以及常用机器学习超参数常用调参范围。大家都知道对于机器学习来说参数是非常重要的。因为大部分时间都是通过调节参数,训练模型来提高精度。因为分析的套路很简单,就那么几步,常用的算法也就那么几个,以为把算法调用一下就可以了么,那是肯定 不行的。实际过程中,调用完算法后,结果一般都不怎么好,这个时候还需要进一步分析,哪些参数可以调优,哪些数据需要进 一步处理,还有什么更合适的算法等等问题。

2019-09-02

数据指标与分析流程.pdf

该文档为数据指标与分析流程,详细介绍了数据分析的流程,格式为PDF。内容清晰,可以作为学习数据分析学习的很好文档。

2019-07-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除