- 博客(8)
- 资源 (2)
- 收藏
- 关注
原创 Keras框架实现Minist手写数字识别
思路:通过构建一个三层的CNN网络,实现数字识别。(图像处理问题)#导入各种用到的模块组件from __future__ import absolute_importfrom __future__ import print_functionfrom keras.preprocessing.image import ImageDataGeneratorfrom keras.models...
2019-05-26 20:18:24 1086
转载 NLP处理的四步:Embed->Encode->Attend->Pred
目录文本类深度学习的四部曲第一步:词向量第二步:编码第三步:注意力机制(Attending)第四步:预测实例1:自然语言推测的可分解注意力模型实例2:文档分类的分层注意力网络假设你有一项强大的技术,可以预测实数稠密向量的类别标签。只要输入输出的格式相同,你就能用这项技术解决所有的问题。与此同时,你有另一项技术,可以用一个向量和一个矩阵预测出另一个向量。那么,现在你手...
2019-05-26 19:12:17 553
翻译 爬取豆瓣前250本书籍信息
参考了这个哥们的思路:https://blog.csdn.net/qq_40123329/article/details/81807759一共250本书,分10页展示,每页25本书。每一个图书的信息:豆瓣网每一个table中的源码格式: <table width="100%"> <tr class="item"> &...
2019-05-21 21:42:11 559
转载 深入理解CNN--这一篇就够了
原文:https://blog.csdn.net/v_JULY_v/article/details/51812459目录2 人工神经网络2.1 神经元2.2 激活函数3 卷积神经网络之层级结构4 CNN之卷积计算层4.1 CNN怎么进行识别4.2 什么是卷积4.3 图像上的卷积4.4 GIF动态卷积图5 CNN之激励层与池化层5.1 ReLU激励层...
2019-05-14 12:57:18 18203 17
原创 推荐系统算法面试题2
15、Bias和Variance的区别Bias度量了学习算法的期望预测与真实结果的偏离程度,即刻画了算法本身的拟合能力。Variance度量了同样大小的训练集的变动所导致的学习性能变化,即刻画了数据扰动所造成的影响。16、对于支持向量机,高斯核一般比线性核有更好的精度,但实际应用中为什么一般用线性核而不用高斯核?如果训练的样本的量很大,训练得到的模型中支持向量的数量太多,在每次做预...
2019-05-08 22:11:07 6503
原创 推荐系统算法面试题1
对推荐系统面试经常问到的一些基础问题进行总结,方便自己记忆。1、模型产生过拟合的原因及解决方案什么是过拟合:模型在训练集上效果较好,在测试集上表现较差。产生过拟合原因:参数太多,模型复杂度高 样本中噪音数据较大,模型学习到了噪音中的特征 对于决策树模型。对决策树的生长没有合理的限制和修建 对于神经网络模型。权值学习迭代次数足够多(overtraining),拟合了训练数据...
2019-05-08 13:26:30 15805
原创 新词获取问题
基于每日用户搜索内容,假设只有少量已知商品的情况下,如何根据用户搜索内容获取平均平台内没有的新商品?答案:这是一条类似于分词“新词获取问题”,答案是基于信息熵+聚合度。需要考虑先做stop库,先去除形容词等。1、信息熵比如用户搜索“曲面屏 白色”,假设商品库中没有显示屏这个商品,我们需要判断“显示屏”是否是潜在的商品,需要考虑“显示屏”左词、右词出现的可能。也就是说如果大...
2019-05-08 10:38:49 188
Python学习手册第三版
2019-01-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人