自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

谢润忠

机器学习 数据挖掘 自然语言处理 AI爱好者 研究生在读

  • 博客(12)
  • 资源 (2)
  • 收藏
  • 关注

原创 xml与html的区别总结

XML是可扩展标记语言,而HTML超文本标记语言。不同之处:1、语法有所不同。XML语法比较严谨而HTML语法比较松散。2、用途不同。XML主要用于数据格式化存储而HTML主要用于网页的编辑。补充知识:二、可扩展标记语言和超文本标记语言之间的差异它不是超文本标记语言的替代。它是对超文本标记语言的补充。它和超文本标记语言为不同的目的而设计:它被设计用来传输和存储数据,其焦点是数据的内...

2019-07-08 16:44:36 6996

转载 XML与HTML 的区别与联系

【什么是xml ?】 xml 即可扩展标记语言,是Internet环境中跨平台的、依赖于内容的技术,是当前处理结构化文档信息的有力工具,满足了Web内容发布与交换的需要,适合作为各种存储与共享的通用平台。 使用xml 标记语言可以做到数据或数据结构在任何编程语言环境下的共享。例如我们在某个计算机平台上用某种编程语言编写了一些数据或数据结构,然后用xml标记语言进行处理,那样的...

2019-07-08 12:00:57 618

转载 初识[html]

【html】——初识网页的背后https://blog.csdn.net/zt15732625878/article/details/53364703

2019-07-08 11:50:48 147

原创 深度学习中几种优化器的分析与对比

前言本文仅对一些常见的优化方法进行直观介绍和简单的比较,各种优化方法的详细内容及公式只好去认真啃论文了,在此我就不赘述了。SGD此处的SGD指mini-batch gradient descent,关于batch gradient descent, stochastic gradient descent, 以及 mini-batch gradient descent的具体区别就不细说了。现...

2019-01-04 09:04:48 1334 1

原创 gensim函数训练Word2Vec模型 具体参数讲解

用gensim函数库训练Word2Vec模型有很多配置参数。这里对gensim文档的Word2Vec函数的参数说明进行翻译。class gensim.models.word2vec.Word2Vec(sentences=None,size=100,alpha=0.025,window=5, min_count=5, max_vocab_size=None, sample=0.001,seed=...

2018-12-27 22:37:45 3018

转载 gensim的word2vec如何得出词向量(python)

利用gensim中的word2vec得到词向量的具体代码实现步骤    点解此链接有详解https://blog.csdn.net/weixin_40292043/article/details/79571346

2018-12-27 22:22:29 1710

转载 Chunkize warning while installing gensim 疑难杂症

1 UserWarning: detected Windows; aliasing chunkize to chunkize_serial2   warnings.warn("detected Windows; aliasing chunkize to chunkize_serial")解决方案: 在import gensim前面加入:1 import warnings2 warnin...

2018-12-27 21:27:18 110

转载 深度学习中经常看到epoch、 iteration和batchsize,下面按自己的理解说说这三个的区别:

深度学习中经常看到epoch、 iteration和batchsize,下面按自己的理解说说这三个的区别:(1)batchsize:批大小。在深度学习中,一般采用SGD训练,即每次训练在训练集中取batchsize个样本训练;(2)iteration:1个iteration等于使用batchsize个样本训练一次;(3)epoch:1个epoch等于使用训练集中的全部样本训练一次;举个例子...

2018-12-27 16:30:20 1666 1

转载 sklearn的train_test_split

train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。格式:X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0) 参数解释...

2018-12-27 08:02:02 157

原创 Keras中shuffle和validation_split的顺序

模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本...

2018-12-27 07:54:34 1184

转载 TensorFlow中的小知识:tf.flags.DEFINE_xxx()

读别人家的代码的时候经常看到这个,结果两三天不看居然忘记了,这脑子绝对上锈了,决定记下来免得老是查来查去的。。。 内容包含如下几个我们经常看到的几个函数: ①tf.flags.DEFINE_xxx() ②FLAGS = tf.flags.FLAGS ③FLAGS._parse_flags()简单的说:用于帮助我们添加命令行的可选参数。 也就是说利用该函数我们可以实现在命令行中选择...

2018-08-29 07:56:39 689

原创 LSTM是如何解决RNN出现的梯度问题

 

2018-08-18 15:56:47 1053

自然语言处理-中文停用词表(1893个)

自然语言处理-最新最全的中文停用词表(1893个),欢迎下载!

2018-08-16

最新中文停用词表(1208个)

自然语言处理,最新最全的中文停用词表(1208个),欢迎下载!

2018-08-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除