- 博客(5)
- 资源 (10)
- 收藏
- 关注
原创 多模态学习-基于文本和图像信息的商品分类框架
将文本model和图像model合并为一个model,因为它们包含了互补的信息。对于图像和文本数据,都是用CNN。对图像数据,使用已经在Image-Net上训练过的网络,该网络已经具有为自然图像提取丰富特征的能力。利用预先训练的机器学习模型称为转移学习。对文本数据,使用一个预先在商品标题上训练好的TextCNN模型。利用预先训练的机器学习模型对新场景重新训练学习的过程称为转移学习。我们希望从这两个...
2017-12-24 09:54:45 8079 12
原创 基于OpenAI Gym学习强化学习
OpenAI Gym是开发和比较强化学习算法的工具包。强化学习关注的是做出好决策,而监督式学习和非监督式学习主要关注的是做出预测。强化学习有两个基本概念:环境(即外部世界)和智能体(即你正在编写的算法)。智能体向环境发送行为,环境回复观察和奖励(即分数)。OpenAI Gym由两部分组成:1.gym开源库:一个测试问题集合—环境(environment),可以用于自己的
2017-12-22 16:14:24 12207 1
原创 Mac下安装Jekyll
安装GemGem是Ruby第三方插件管理器安装jekyllgem install jekyll执行 jekyll 命令进入工程根目录,执行命令本地启动网页jekyll server 或 jekyll s遇到问题: Deprecation: The 'gems' configuration option has been renamed to 'p
2017-12-20 15:50:03 685
原创 大规模特征编码问题和工程实践
方式1:序号编码根据特征在整个特征集合中的index进行编码。在Spark里的编码逻辑:1.把样本集合的特征map{feature:value}放到一个Set集合里,然后取集合的index作为一个特征feature:value的编号,map{map{feature:value}:index}。2.然后将每条样本转成index表示的fea_ids。2.最后将每条样本表示成Spar...
2017-12-14 14:58:07 1747
原创 Sequence Modeling With CTC
Connectionist Temporal Classification(CTC) 是一种用来在语音识别、手写体识别等序列问题中训练深度神经网络的算法。 考虑下语音识别。 我们有一个音频剪辑片段数据集和相应的转录。 但不幸的是,我们不知道转录中的字符如何与音频对齐。这让训练一个语音识别器的难度比初看起来的要大。失去这种对齐,简单的方法对我们来说不能用了。 我们可以制定一个规则,比如“一
2017-12-13 15:14:45 1770
使用颜色纹理直方图来进行目标跟踪
2012-11-22
多目标行人检测
2012-11-22
PCA降维程序
2012-11-22
LAMP_HMM 隐马尔科夫模型
2012-05-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人