自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

转载 机器学习探索性数据分析的数据类型

数据类型是统计学中的重要概念,我们需要对它有正确的理解方能利用正确的数据类型来获得结论。这篇文章将介绍几种用于机器学习探索性数据分析的数据类型,以便正确的把握和利用数据。对数据结构的良好理解对于机器学习中探索性分析十分重要,对于不同的数据类型我们需要不同的统计学度量手段来进行分析测试。同时也需要根据数据的类型选择合适的可视化方式来帮助我们更好的理解数据。最后数据类型也为变量的分类提供了一个有效的途...

2018-04-22 00:53:23 1913

原创 深度学习实践

很久之前的大连理工大学信息检索研究室2017深度学习实践培训内容,当时听讲的时候的笔记。Representation LearningWord EmbeddingWord2vec窗口内的词向量更接近Glove考虑了词的共享次数FastText考虑了字粒度的n-gramWordRank使用排序方法训练Doc2vec将文档作为一个...

2018-04-16 00:55:56 828

原创 Theano中如何只更新一部分权重,用法及理由。

如果你想只更新权重矩阵的一个子集(例如一些行或列)。这种情况下神经网络只利用这个子集来进行前向传播,那么成本函数(cost function),只应取决于迭代过程中使用的权重的子集。举一个自然语言处理中的例子:例如,如果你想学习一个查找表(lookup table),来做词嵌入,每一行是一个词向量。在每个迭代中,更新的参数应该只是在向前传播中使用到的那些行。对应于theano函数,为查找表...

2018-04-15 23:30:05 1102

原创 深度学习库提供了什么?

通过使用多种深度学习库,可以发现,深度学习库普遍提供了以下功能来帮助我们更好的实现深度学习模型:矩阵运算性能优化以及使用GPU训练自动微分解决数值稳定问题符号式编程(Theano、Tensorflow) -定义计算流程; -把计算流程编译成可执行的程序; -给定输入,调用编译好的程序执行。Theano http://deeplearning.net/softwar...

2018-04-15 22:37:23 679

原创 机器学习与其他相似概念

灌水占位一篇,看后续再详尽论述。机器学习与数据挖掘机器学习:一种假设数据挖掘:从数据中发现模式机器学习与人工智能机器学习是实现人工智能的一种方法机器学习与统计学统计学可以用来做机器学习和数据挖掘 机器学习基石...

2018-04-15 22:31:56 692

原创 深度学习训练中如何处理NaNs

NaNs问题(Dealing with NaNs)相信很多自己实现过深度学习模型或者训练过深度学习模型的人都会知道,产生NaNs或者Infs是一件特别常见的事情。但是NaNs的问题又往往很棘手,因为出现NaN的原因可能有很多,诊断起来并不容易。这可能是因为模型中某个地方设置的不是特别合理,或者代码中出现了Bug。也有可能是出现了数值不稳定,数值不稳定问题会进行单独说明。甚至也可能是你的算法...

2018-04-15 22:19:37 3714

原创 计算机网络第三记:网络安全

《计算机网络:自顶向下方法》换换脑子,继续看一个网络问题,本篇文章为依旧为读书笔记。黑帽子能经互联网传播有害程序可以统称为恶意软件(malware)。被恶意软件侵害的主机也可能成为数以千计的类似受寒设备网络中的一员,统称为僵尸网络(botnet)。 黑帽子可能利用僵尸网络控制并有效地对目标主机展开垃圾邮件分发或分布式攻击服务攻击。恶意软件能以病毒或蠕虫的形式扩散: ...

2018-04-06 01:02:06 511

原创 计算机网络第二记:协议层次

《计算机网络:自顶向下方法》换换脑子,接着看一个网络问题,本篇文章为依旧为读书笔记。协议分层概念化结构化网络设计者以 分层(layer) 的方式组织协议以及实现这些协议的网络硬件和软件。各层的所有协议被称为协议栈(protocol stack)。因特网的协议栈由5个层次组成:物理层、链路层、网络层、运输层、应用层。因特网协议栈不是为一个的协议栈,20世纪70年...

2018-04-06 00:33:11 554

原创 信息检索:基于知识图谱和深度学习的文本表示和搜索(Explicit and distributed semantics for text representation and retrieval)

https://pan.baidu.com/s/1hsaMmTe https://pan.baidu.com/s/1nvyY5kP Language Technologies Institute - Carnegie Mellon University - Chenyan Xiong本篇博文是根据论文作者分享讲座整理,主要介绍了作者用知识图谱和分布式表示扩展语义信息来做信息...

2018-04-05 22:30:31 4736

原创 计算机网络第一记:网络核心

《计算机网络:自顶向下方法》换换脑子,今天看一个网络问题,本篇文章为依旧为读书笔记。通过网络链路和交换机移动数据有两种基本方法:电路交换(circuit switching)和分组交换(packet switching)电路交换例如传统的电话网络。是一个名副其实的连接,当网络创建这种电路时,在连接期间在该网络链路上预留了恒定的传输速率。这又有了 频分复用(Frequ...

2018-04-05 01:06:54 779

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除