- 博客(8)
- 资源 (14)
- 收藏
- 关注
原创 TensorFlow训练词向量(附github)
前言 这篇文章将尝试根据word2vec的原理并使用TensorFlow来训练词向量,这里选择使用skip-gram模型。 语料库的准备 这里仅仅收集了网上关于房产新闻的文章,并且将全部文章拼凑到一起形成一个语料库。 skip-gram简要说明 skip-gram核心思想可以通过下图来看,假设我们的窗口大小为2,则对于文本"The quick brown fox jumps over the la...
2019-02-25 16:39:47 6195
转载 动态规划求解最长公共子序列
前言推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种...
2019-02-25 08:00:00 766
原创 业务系统如何引入神经网络
切入点 目前的AI其实更多就是仅仅用来从历史数据中学习到一些规律而已,在业务上,更多的只是减少人为介入工作,所以要在业务系统中引入神经网络,其实主要就是在要找到切入点。 简单来说,可以走访一线用户看他们花最多的时间在系统哪些地方,经常重复了哪些工作,也可以通过统计日志找到合适的切入点。 理解问题 业务上要解决的问题:预测某个分类。 问题涉及到的信息管道:xx。 数据源及采集方式:数据源在xx业务...
2019-02-20 11:23:52 351
原创 如何用TensorFlow训练聊天机器人(附github)
前言 实际工程中很少有直接用深度学习实现端对端的聊天机器人,但这里我们来看看怎么用深度学习的seq2seq模型来实现一个简易的聊天机器人。这篇文章将尝试使用TensorFlow来训练一个基于seq2seq的聊天机器人,实现根据语料库的训练让机器人回答问题。 循环神经网络 在seq2seq模型中会使用到循环神经网络,目前流行的几种循环神经网络包括RNN、LSTM和GRU。 训练样本集 主要是一些QA...
2019-02-20 11:13:27 1664 1
原创 计数排序vs基数排序vs桶排序
从计数排序说起 计数排序是一种非基于元素比较的排序算法,而是将待排序数组元素转化为计数数组的索引值,从而间接使待排序数组具有顺序性。 计数排序的实现一般有两种形式:基于辅助数组和基于桶排序。 基于辅助数组 整个过程包含三个数组:待排序数组A、计数数组B和输出数组C。 简单来说,就是通过统计待排序数组A中元素不同值的分布直方图,生成计数数组B,然后计算计数数组B的前缀和(此步操作可以看成计算待排序数...
2019-02-18 08:24:24 439
原创 机器学习判别式与生成式
判别&生成 在机器学习中,对于监督学习我们可以将其分为两类模型:判别式模型和生成式模型。可以简单地说,生成式模型是针对联合分布进行建模,而判别式模型则针对条件分布建模。 从感性上认识,生成式能学习到更多信息,而判别式则较少,就好比学习英语,有类人只学会听懂这是英语,有类人学会了听懂这是英语并且知道说的是什么。另外,生成式模型在一定条件下也可以转换成判别式模型,比如通过贝叶斯公式进行转换。 ...
2019-02-14 08:50:49 674 1
原创 基于桶的基数排序
前言 推出一个新系列,《看图轻松理解数据结构和算法》,主要使用图片来描述常见的数据结构和算法,轻松阅读并理解掌握。本系列包括各种堆、各种队列、各种列表、各种树、各种图、各种排序等等几十篇的样子。 基数排序 基数排序(Radix Sort)算法是一种非比较的排序算法,早在 1887 年 Herman Hollerith 就已经在打孔卡片制表机中使用该算法。一般多用于对整数的排序,但由于整数与某些字符...
2019-02-11 08:30:31 398 2
原创 了解模式识别
关于模式识别 对模式的识别是人类智慧的一个重要体现,人类具有很强的模式识别能力,能对千千万万的具体的物质进行识别,也能对事物进行高级抽象后的模式进行识别。一个人对模式识别的学习从小孩就开始,知道了这是花草、那是蓝天白云。这些对人类来说很简单的事情,其实是很复杂的智能行为。 关于模式 模式(pattern)可以看成是一种规律,可以用于刻画事物的原型或表征事物的特征,比如花的形状、狗吠的声音等等。我们...
2019-02-01 10:31:05 514
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人