谓之小一

至大之内,谓之大一!至小之内,谓之小一!

知识图谱|298万条三元组生成方法(一)

本篇文章接《Python爬虫|Get豆瓣电影与书籍详细信息》,学习如何利用爬取的数据,构建知识图谱所需的三元组。主要内容包括如何从Json类型的数据,转换成RDF数据,并最终存储到Jena之中,然后利用SPARQL进行查询。数据链接: https://pan.baidu.com/s/1cLdsAX...

2019-03-10 17:44:17

阅读数 236

评论数 0

Python爬虫|Get豆瓣电影与书籍详细信息

最近在做关于知识图谱方面的实验,需要一些数据,于是爬取了豆瓣上关于电影和书籍的信息。两天时间内共爬取 20W+ 条数据,包括电影信息、电影演员信息、书籍信息、书籍作者信息,GitHub链接为https://github.com/weizhixiaoyi/DouBan-Spider。 1. 数据说...

2019-03-02 17:52:00

阅读数 56

评论数 0

Ununtu16.04搭建GitLab服务器教程

Ununtu16.04搭建GitLab服务器教程 文章目录Ununtu16.04搭建GitLab服务器教程1.依赖包安装2.GitLab安装2.1官方教程2.2清华源3.GitLab启动4.GitLab配置4.1更改服务器IP地址4.2更改服务器端口4.3设置GitLab开机自启动5.GitLab...

2019-02-19 09:59:40

阅读数 53

评论数 0

详解准确率、精确率、召回率、F1值等评价指标的含义

机器学习问题之中,通常需要建立模型来解决具体问题,但对于模型的好坏,也就是模型的泛化能力,如何进行评估呢? 很简单,我们可以定一些评价指标,来度量模型的优劣。比如准确率、精确率、召回率、F1值、ROC、AUC等指标,但是你清楚这些指标的具体含义吗?下面我们一起来看看吧。 1.混淆矩阵 介绍各个指标...

2019-01-31 20:55:00

阅读数 898

评论数 0

机器学习之交叉验证

1.交叉验证简介 交叉验证(Cross Validation) 是在机器学习建立模型和验证模型参数时常用的方法。顾名思义,就是重复的使用数据,把得到的样本数据进行切分,组合为不同的训练集和测试集。用训练集来训练模型,测试集来评估模型的好坏。在此基础上可以得到多组不同的训练集和测试集,某次训练集中的...

2019-01-30 16:30:56

阅读数 85

评论数 0

机器学习降维之线性判别模型(LDA)

1.LDA简介 线性判别分析(Linear Discriminant Analysis, LDA) 是一种监督学习的降维方法,也就是说数据集的每个样本是有类别输出。和之前介绍的机器学习降维之主成分分析(PCA)方法不同,PCA是不考虑样本类别输出的无监督学习方法。LDA的原理简单来说就是将带上标签...

2019-01-29 16:13:04

阅读数 56

评论数 0

机器学习降维之奇异值分解(SVD)

奇异值分解(Singular Value Decompostion, SVD) 是在机器学习领域广泛应用的算法,不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石。本篇文章对SVD原理做主要讲解,在学习之前,确保你已经熟悉线性代数中的基本知识,包...

2019-01-01 20:42:14

阅读数 1366

评论数 2

机器学习降维之主成分分析(PCA)

主成分分析(Principal components analysis, PCA) 是最重要的降维方法之一,在数据压缩、消除冗余和数据噪音消除等方面有广泛的应用。通常我们提到降维算法,最先想到的就是PCA,下面我们对PCA原理进行介绍。 1. PCA思想 PCA就是找出数据中最主要的方面,用数据...

2018-12-30 21:12:13

阅读数 870

评论数 1

Gibbs采样

在MCMC采样和M-H采样中,我们讲到M-H采样已经可以很好的解决蒙特卡罗方法需要的任意概率分布的样本集问题。但是M-H采样有两个缺点:一是需要计算接受率,在高维情况下计算量非常大,同时由于接受率的原因导致算法收敛时间变长。二是有些高维数据,特征的条件概率分布方便求解,但特征的联合分布很难求解。因...

2018-12-16 13:46:28

阅读数 328

评论数 0

MCMC采样和M-H采样

在MCMC之马尔可夫链之中我们介绍到,给定一个概率分布π,很难直接找到对应的马尔可夫链状态转移矩阵P。只要解决这个问题,我们便可以找到一种通用的概率分布采样方法,进而用于蒙特卡罗模拟。下面我们来介绍如何找到马尔可夫链所对应的状态转移矩阵P。 1.马尔可夫链细致平稳条件 解决平稳分布π所对应的马尔可...

2018-12-15 18:36:34

阅读数 227

评论数 0

MCMC之马尔可夫链

在MCMC之蒙特卡罗方法之中,讲到如何利用蒙特卡罗方法来随机模拟求解一些复杂的连续积分或者离散求和方法。但蒙特卡罗方法需要得到对应的概率分布的样本集,而对于某些概率分布,得到这样的样本集很困难,因此本篇我们将介绍马尔可夫链来解决这种问题。 1.马尔可夫链简介 马尔可夫链定义比较简单,它假设某一时刻...

2018-12-03 09:38:05

阅读数 214

评论数 0

MCMC之蒙特卡罗方法

1.MCMC简介 **马尔可夫链蒙克卡罗(Markov Chain Monte Carlo,MCMC)**是一种随机采样方法,在机器学习、深度学习及自然语言处理等领域都有广泛的应用,是很多复杂算法求解的基础,例如受限玻尔兹曼机(RBM)便是用MCMC来做一些复杂算法的近似求解。在具体讲解什么是MC...

2018-12-01 23:53:17

阅读数 396

评论数 0

LSTM神经网络之前向反向传播算法

上篇文章我们已经学习了循环神经网络的原理,并指出RNN存在严重的梯度爆炸和梯度消失问题,因此很难处理长序列的数据。本篇文章,我们将学习长短期记忆网络(LSTM,Long Short Term Memory),看LSTM解决RNN所带来的梯度消失和梯度爆炸问题。 1.从RNN到LSTM RNN模型具...

2018-11-15 21:43:57

阅读数 275

评论数 0

循环神经网络之前向反向传播算法

前面我们已经介绍了深度神经网络和卷积神经网络,这些算法都是前向反馈,模型的输出和模型本身没有关联关系。今天我们学习输出和模型间有反馈的神经网络,循环神经网络(Recurrent Neual Networks),其广泛应用于自然语言处理中的语音识别,书写识别和机器翻译等领域。 1.RNN简介 前面介...

2018-11-04 17:23:32

阅读数 465

评论数 0

卷积神经网络之反向传播算法

前面已经推导学习了卷积神经网络之前向传播算法,本篇文章将推导卷积神经网络之反向传播算法。在学习卷积神经网络算法之前,希望你对深度神经网络有一定程度的了解,我在之前也有写过相关的文章,包括深度神经网络之前向传播算法、深度神经网络之反向传播算法、深度神经网络之损失函数和激活函数、深度神经网络之正则化,...

2018-10-21 21:11:28

阅读数 358

评论数 0

卷积神经网络之前向传播算法

0.杂谈 本来个人是准备毕业直接工作的,但前段时间学校保研大名单出来之后,发现本人有保研机会,于是就和主管请了几天假,回学校准备保研的事情。经过两天的准备,也是非常幸运,成功拿到本院的保研名额。明确得到保研名额的时候已经是9月18号,然而国家推免系统开放时间是9月28号,也就是说我只还有10天时间...

2018-10-20 21:08:40

阅读数 2061

评论数 0

进程、线程、锁的概念

大雾!可以说很大意啦! 上周五终于改好bug,想着把代码同步到个人GitHub上面,就随手git push同步到远程。然而万万没想到,之前touch过一个information.txt文件,里面记录着一些服务器信息,然后也跟着同步到远程仓库去啦。等到周一,敏感信息被公司检测出来,通知删除。 可...

2018-08-28 20:17:31

阅读数 410

评论数 0

基于google protobuf的gRPC实现(python版)

1.Protobuf简介 Google Protocol Buffers简称Protobuf,提供一种灵活、高效、自动化的机制,用于序列化结构数据。Protobuf仅需自定义一次所需要的数据格式,然后我们就可以使用Protobuf编译器自动生成各种语言的源码,方便我们读写自定义的格式化数据。另外...

2018-08-14 20:41:32

阅读数 599

评论数 1

Linux常用命令

1.常用指令 ls显示文件或目录 ​ -l列出文件详细信息(list) ​ -a列出当前目录下所有文件及目录,包含隐藏的a(all) mkdir创建目录 ​ -p创建目录,若无父目录,则创建p(parent) cd切换目录 ...

2018-08-14 11:30:14

阅读数 76

评论数 0

《剑指Offer》Python版

1.二维数组中的查找 题目: 在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。 思路:遍历每一行,查找该元素是否在该行之中。 # -*- cod...

2018-08-06 11:59:30

阅读数 2938

评论数 2

提示
确定要删除当前文章?
取消 删除
关闭
关闭