2019年05月_fly_Xiaoma

12月 11月 10月 09月 08月 07月 06月 05月 04月 03月 02月 01月

原创 Keras框架实现Minist手写数字识别

思路：通过构建一个三层的CNN网络，实现数字识别。（图像处理问题）#导入各种用到的模块组件from __future__ import absolute_importfrom __future__ import print_functionfrom keras.preprocessing.image import ImageDataGeneratorfrom keras.models...

2019-05-26 20:18:24 1086

转载 NLP处理的四步：Embed->Encode->Attend->Pred

目录文本类深度学习的四部曲第一步：词向量第二步：编码第三步：注意力机制(Attending)第四步：预测实例1：自然语言推测的可分解注意力模型实例2：文档分类的分层注意力网络假设你有一项强大的技术，可以预测实数稠密向量的类别标签。只要输入输出的格式相同，你就能用这项技术解决所有的问题。与此同时，你有另一项技术，可以用一个向量和一个矩阵预测出另一个向量。那么，现在你手...

2019-05-26 19:12:17 553

翻译爬取豆瓣前250本书籍信息

参考了这个哥们的思路:https://blog.csdn.net/qq_40123329/article/details/81807759一共250本书，分10页展示，每页25本书。每一个图书的信息：豆瓣网每一个table中的源码格式： <table width="100%"> <tr class="item"> &...

2019-05-21 21:42:11 559

原创爬虫架构图

爬虫的总体架构：

2019-05-21 18:06:51 4359

转载深入理解CNN--这一篇就够了

原文：https://blog.csdn.net/v_JULY_v/article/details/51812459目录2 人工神经网络2.1 神经元2.2 激活函数3 卷积神经网络之层级结构4 CNN之卷积计算层4.1 CNN怎么进行识别4.2 什么是卷积4.3 图像上的卷积4.4 GIF动态卷积图5 CNN之激励层与池化层5.1 ReLU激励层...

2019-05-14 12:57:18 18203 17

原创推荐系统算法面试题2

15、Bias和Variance的区别Bias度量了学习算法的期望预测与真实结果的偏离程度，即刻画了算法本身的拟合能力。Variance度量了同样大小的训练集的变动所导致的学习性能变化，即刻画了数据扰动所造成的影响。16、对于支持向量机，高斯核一般比线性核有更好的精度，但实际应用中为什么一般用线性核而不用高斯核？如果训练的样本的量很大，训练得到的模型中支持向量的数量太多，在每次做预...

2019-05-08 22:11:07 6503

原创推荐系统算法面试题1

对推荐系统面试经常问到的一些基础问题进行总结，方便自己记忆。1、模型产生过拟合的原因及解决方案什么是过拟合：模型在训练集上效果较好，在测试集上表现较差。产生过拟合原因：参数太多，模型复杂度高样本中噪音数据较大，模型学习到了噪音中的特征对于决策树模型。对决策树的生长没有合理的限制和修建对于神经网络模型。权值学习迭代次数足够多（overtraining），拟合了训练数据...

2019-05-08 13:26:30 15805

原创新词获取问题

基于每日用户搜索内容，假设只有少量已知商品的情况下，如何根据用户搜索内容获取平均平台内没有的新商品？答案：这是一条类似于分词“新词获取问题”，答案是基于信息熵+聚合度。需要考虑先做stop库，先去除形容词等。1、信息熵比如用户搜索“曲面屏白色”，假设商品库中没有显示屏这个商品，我们需要判断“显示屏”是否是潜在的商品，需要考虑“显示屏”左词、右词出现的可能。也就是说如果大...

2019-05-08 10:38:49 188

Python学习手册第三版

这是Python学习手册第三版，有需要的同学可以看一下。这本书的风格不同于以往的技术类书籍。它是分模块来讲的：数字、字符串、元组、列表字典、循环、函数等这些不同的模块分别来讲。感兴趣的可以下载。

2019-01-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人