![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
mawenqi0729
软件工程专业,嵌入式方向,大三
展开
-
CNN学习和遇到的问题与keras简介
CNN学习及遇到的问题与keras简介CNN学习从神经网络到卷积神经网络(CNN)**我们知道神经网络的结构是这样的:那卷积神经网络跟它是什么关系呢?其实卷积神经网络依旧是层级网络,只是层的功能和形式做了变化,可以说是传统神经网络的一个改进。比如下图中就多了许多传统神经网络没有的层次。卷积神经网络的层级结构数据输入层/ Input layer...原创 2018-06-14 20:08:54 · 2956 阅读 · 0 评论 -
什么是词向量?(NPL入门)
什么是词向量?我们组实训选择的主题是与自然语言识别相关的,那么就不得不学习和了解一下自然语言识别中非常重要和基础的。于是我对于自己对词向量的学习进行了以下的总结。简而言之,词向量技术是将词转化成为稠密向量,并且对于相似的词,其对应的词向量也相近。一、词的表示在自然语言处理任务中,首先需要考虑词如何在计算机中表示。通常,有两种表示方式:one-hot representa...原创 2018-06-14 21:09:47 · 113480 阅读 · 13 评论 -
one-hot向量与word2vec
one-hot向量与word2vecone-hot向量1.1 one-hot编码 什么是one-hot编码?one-hot编码,又称独热编码、一位有效编码。其方法是使用N位状态寄存器来对N个状态进行编码,每个状态都有它独立的寄存器位,并且在任意时候,其中只有一位有效。举个例子,假设我们有四个样本(行),每个样本有三个特征(列),如图: 上图中我们已经对每个特征进行了...原创 2018-06-14 21:46:33 · 17187 阅读 · 2 评论 -
新闻分类器的模型训练与单篇分类(cnn+word2vec)
新闻分类器的模型训练与单篇分类(cnn+word2vec)在cnn之上引入word2vec的好处:(1)间接引入外部训练数据,防止过拟合;(2)减少需要训练的参数个数,提高训练效率数据预处理将下载的原始数据进行转码,然后给文本标类别的标签,然后制作训练与测试数据,然后控制文本长度,分词,去标点符号哎,坑多,费事,比较麻烦首先,搜狗实验室提供的数据下载下来是 xml 格式...原创 2018-06-15 09:28:11 · 9707 阅读 · 2 评论 -
新闻关键字提取和新闻推荐
新闻关键字提取和新闻推荐jieba——超好用的分词器在介绍我自己的关键字提取之前先介绍一下这个中文处理的包,现在在中文处理里使用非常广泛,也真的效率很高使用便捷。有非常多的功能,也有关键字提取的功能,但是效率一般,不如它的分词功能使用的人多,那么我介绍一下在我的代码会用到的它的2个功能。结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式,下面对这三种模式分别举例介绍:...原创 2018-06-15 11:29:36 · 14017 阅读 · 9 评论