机器学习
jiangda_0_0
这个作者很懒,什么都没留下…
展开
-
tensorflow中mnist 使用cnn模型训练的输出层数为7x7的原因
returntf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')Given an input tensor of shape `[batch, in_height, in_width, in_channels]`x的输入各列含义为[batch,输入高度,输入宽度,输入通道数]W为[filter_height, filter_w原创 2016-09-21 18:30:33 · 1149 阅读 · 0 评论 -
在机器学习中各分类方法的优缺点
作者:Jason Gu链接:https://www.zhihu.com/question/24169940/answer/26952728来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。尝试将quora上的这个回答翻译了下。第一次翻译,不好之处请见谅。What are the advantages of different classifi转载 2017-03-13 12:02:08 · 4306 阅读 · 0 评论 -
Spark XGBoost的一些问题
在使用Spark版本的xgboost的时候会有一些单机版本遇不到的问题,可能对使用的人造成一些困扰,经过两周的踩坑,总结一下,希望有帮助1、输入、预测数据的一致性Spark版本的XGBoost处理的输入可以是RDD或者DataFrame。由于Spark的机制,在没有显式指定的情况下,是不会保存RDD或者DataFrame的内容的。所以预测之后得到结果的RDD和原本输入的RDD不能够保证对应原创 2017-12-06 11:28:14 · 4471 阅读 · 1 评论 -
文本分类的一些建议
文本分类模型常用的文本分类方法有,TF-IDF、Word2Vec、NB、SVM、LR、RNN、CNN等传统的文本分类模型需要大量的特征工程,而基于神经网络的模型,通过向量化词语,可以省去大量的特征工程。往往有比较好的效果使用RNN模型可以捕捉文本的上下文信息,CNN模型的效果受window大小的影响比较大,window的大小定义了模型的“视野”的大小,所以这里我们使用RNN模型,常见的实现有LST...原创 2018-05-09 20:09:01 · 927 阅读 · 0 评论