FM分解机及其变种(FFM、DeepFM)原理详解

FM(分解机,Factorization Machines) 线性回归: y^(x)=w0+w1x1+w2x2+...+wnxn=w0+∑i=1nwixi\hat{y}(x) = w_0+w_1x_1+w_2x_2+...+w_nx_n=w_0+\sum^n_{i=1}w_ix_iy^​(x)=w...

2019-05-20 17:37:05

阅读数 33

评论数 0

机器学习中的数学原理——矩阵论

正定矩阵 在线性代数里,正定矩阵 (positive definite matrix) 有时会简称为正定阵。 定义: AAA是n阶方阵,如果对任何非零向量xxx,都有xTAx>0x^TAx>0xTAx>0,其中xTx^TxT 表示xxx的转...

2019-05-20 11:29:52

阅读数 89

评论数 0

python数据预处理——直方图和热力图绘制

一、绘制直方图 首先读入数据 def read_data(): path = '../data/forCodeF-2.csv' data = pd.read_csv(path,encoding='gbk') return data 然后调用matplotlib.pyplo...

2019-05-17 16:47:49

阅读数 9

评论数 0

使用sklearn对数据进行标准化/正则化

一、标准化/正则化 1. 0-1标准化 也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下: x∗=x−minmax−minx^*= \frac{x-min} {max-min}x∗=max−minx−min​ 其中max为样本数据的最大值,min为样本数据的最小值。这...

2019-05-17 15:38:47

阅读数 4

评论数 0

使用中文维基百科训练word2vec模型

1.下载原始数据 数据下载地址:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 首先把需要下载的东西都列出来 一、下载内容 1.语料:下载地址是https://dumps.wikimedi...

2019-05-08 19:43:34

阅读数 14

评论数 0

python图片去重

爬虫获取的图片经常会有不同名但相同或相似的情况,因此需要对图片进行去重。 以下介绍两种方法。 一、图片通过md5去重 import md5 import os from time import clock as now def getmd5(filename): file_txt = ...

2019-05-07 10:20:13

阅读数 25

评论数 0

基于医疗知识图谱的问答系统源码详解

项目还是找的中科院软件所刘焕勇老师在github上的开源项目,基于知识图谱的医药领域问答项目QABasedOnMedicaKnowledgeGraph。 该项目立足医药领域,以垂直型医药网站为数据来源,以疾病为核心,构建起一个包含7类规模为4.4万的知识实体,11类规模约30万实体关系的知识图谱。...

2019-05-06 16:19:55

阅读数 227

评论数 2

IOS静态分析工具oclint安装流程

1 简介 OCLint是一个强大的静态代码分析工具,可以用来提高代码质量,查找潜在的bug,主要针对c,c++和Objective-c的静态分析。功能非常强大,而且是出自国人之手。项目地址:http://oclint.org/。 主要能检查到的代码缺陷: 可能出现的bug,空的if/else/t...

2019-04-23 15:21:57

阅读数 9

评论数 0

基于医疗知识图谱的问答实践中遇到的问题

问题1:ahocorasick安装失败 原因:改名为pyahocorasick,pip安装依然失败。error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools&qu...

2019-04-22 17:19:34

阅读数 339

评论数 4

Neo4j安装及简单使用

一、Neo4j和图数据库简介 neo4j是基于Java语言编写图形数据库。图是一组节点和连接这些节点的关系。图形数据库也被称为图形数据库管理系统或GDBMS。 Neo4j的是一种流行的图形数据库。 其他的图形数据库是Oracle NoSQL数据库,OrientDB,HypherGraphDB,Gr...

2019-04-15 21:47:39

阅读数 22

评论数 0

Seq2Seq和Attention机制详解

一、Seq2Seq简介 seq2seq模型最早可追溯到2014年的两篇paper [1, 2],主要用于机器翻译任务(MT)。 seq2seq 是一个Encoder–Decoder 结构的网络,它的输入是一个序列,输出也是一个序列, Encoder 中将一个可变长度的信号序列变为固定长度的向量表达...

2019-04-12 11:29:20

阅读数 211

评论数 0

TensorFlow实现单层及多层LSTM的MNIST分类和可视化

The MNIST data-set MNIST data-set由一些黑白照片集合组成,每张照片包含手写的数字。图像被格式成28*28像素,并可表示成一个数值矩阵。集合中60000张照片用来训练模型,10000张照片用来测试模型。MNIST data-set可通过网络在MNIST数据库中获得。 ...

2019-04-09 10:08:27

阅读数 103

评论数 0

面试准备-RNN和LSTM

LSTM结构推导,为什么比RNN好? 推导forget gate,input gate,cell state, hidden information等的变化;因为LSTM有进有出且当前的cell informaton是通过input gate控制之后叠加的,RNN是叠乘,因此LSTM可以防止梯度消...

2019-04-08 16:07:53

阅读数 435

评论数 1

Bi-LSTM原理及TensorFlow实现序列标注

本文整理了Bi-LSTM的原理,并在静觅博客静觅:TensorFlow Bi-LSTM实现序列标注 的基础上对TensorFlow 搭建一个Bi-LSTM来处理序列标注问题的代码进行了详细的注释。 Bi-LSTM理解 RNN的意思是,为了预测最后的结果,我先用第一个词预测,当然,只用第一个预测的...

2019-04-02 16:58:21

阅读数 175

评论数 3

知识图谱与KBQA——槽填充

一、相关概念 开放域对话:不太严谨的定义可以理解为 ,在不确定用户意图前的各种瞎聊,你不知道用户会问什么样千奇百怪的问题,但是chatbot都能接住,然后和用户进行对话,这种就是开放域的对话。 填槽:填槽指的是为了让用户意图转化为用户明确的指令而补全信息的过程。 准入条件:从一个开放域转入到封闭域...

2019-04-01 17:29:45

阅读数 271

评论数 0

知识图谱与KBQA——意图识别

意图识别是通过分类的办法将句子或者我们常说的query分到相应的意图种类。 在做这个工作之前,我们首先得想好意图的划分问题,这种划分业界有很多叫法,比如技能。 意图识别的基本方法 1.基于词典以及模版的规则方法 不同的意图会有的不同的领域词典,比如书名,歌曲名,商品名等等。当一个用户的意图来了以后...

2019-04-01 14:35:20

阅读数 180

评论数 0

Python图形处理库PIL简单用法

所谓位图,又称栅格图(英语:Raster graphics)或点阵图,是使用像素阵列(Pixel-array/Dot-matrix点阵)来表示的图像。位图的像素都分配有特定的位置和颜色值。每个像素的颜色信息由RGB组合或者灰度值表示。根据位深度,可将位图分为1、4、8、16、24及32位图像等。每...

2019-03-19 19:25:36

阅读数 19

评论数 0

面试准备-排序算法归纳

1.快速排序 排序的时间复杂度 最坏情况:以大O记号形式表示的时间复杂度,给出了一个算法的最坏情况,即--对于规模为n的任意输入,算法的运行时间都不会超过O(f(n)) 最好情况 :大 Ω记号-->如果存在正的常数c和函数g(n),对任意n&g...

2019-03-19 19:24:34

阅读数 18

评论数 0

面试准备-常问代码题

题目一: 1.给定一个数组,升序数组,将他构建成一个BST 思路:升序数组,这就类似于中序遍历二叉树得出的数组,那么根节点就是在数组中间位置,找到中间位置构建根节点,然后中间位置的左右两侧是根节点的左右子树,递归的对左右子树进行处理,得出一颗BST # Definition for a binar...

2019-03-15 00:43:55

阅读数 44

评论数 0

面试准备-python 十大经典排序算法

本文转载自:python 十大经典排序算法     排序算法可以分为内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的排序记录,在排序过程中需要访问外存。常见的内部排序算法有:插入排序、希尔排...

2019-03-05 16:42:39

阅读数 71

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭