自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赖德发的博客

征途路上,星辰大海,交流微信:laidefa

原创 【java 走进NLP】simhash 算法计算两篇文章相似度

python 计算两篇文章的相似度算法simhash见: https://blog.csdn.net/u013421629/article/details/85052915 对长文本 是比较合适的(超过500字以上) 下面贴上java 版本实现: pom.xml 加入依赖 <depe...

2018-12-17 18:08:56

阅读数 715

评论数 3

原创 【python 走进NLP】simhash 算法计算两篇文章相似度

SimHash算法 simhash算法的主要思想是降维,将高维的特征向量映射成一个f-bit的指纹(fingerprint),通过比较两篇文章的f-bit指纹的Hamming Distance来确定文章是否重复或者高度近似。 主要分以下几步: 1、抽取文本中的关键词及其权重。 2、对关键词...

2018-12-17 17:37:38

阅读数 1333

评论数 0

原创 【python 走进NLP】文本相似度各种距离计算

主要内容: 1. 余弦相似度 2. 欧氏距离 3. 曼哈顿距离 4. 切比雪夫距离 5. 杰尔德距离 6. 汉明距离 7. 标准化欧式距离 8. 皮尔逊相关系数 # -*- coding:utf-8 -*- import numpy as np from scipy....

2018-12-17 15:33:04

阅读数 364

评论数 1

原创 【python 走进NLP】句子相似度计算--余弦相似度

余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。余弦相似度将向量根据坐标值,绘制到向量空间中,如最常见的二维空间。 # -*- coding: utf-8 -*- import jieba import numpy as np def get_w...

2018-12-17 11:05:18

阅读数 3432

评论数 0

原创 【python 图片搜索】python 快速计算两个图片的相似度

一、图片相似度检测算法原理 我们日常中处理的数据大多数是文本和图片,既然文本有文本相似度,图片肯定也有图片相似度呀,是不是。下面介绍图片相似度检测的算法:检查两个图片的相似度,一个简单而快速的算法:感知哈希算法(Perceptual Hash),通过某种提取特征的方式为每个图片计算一个指纹(哈希...

2018-12-14 18:05:07

阅读数 1787

评论数 0

原创 【python 图片识别】python识别图片是不是包含二维码

近几天在研究二维码的识别,主要是通过python代码来识别特定图片内是否包含二维码。方法有分类,还有下面我介绍的直接法。 需要安装库 pip install pyzbar pip install opencv-python 我们 先准备些二维码 总共有11个二维码。 下面我们...

2018-12-06 15:49:56

阅读数 2172

评论数 0

原创 【python 文件操作】shutil模块和OS模块

总结 os包: rmdir, mkdir, listdir, remove, rename, chmod, chown, stat, symlink shutil包: copy, move os包 os包包括各种各样的函数,以实现操作系统的许多功能。这个包非常庞杂。os包的一些命令就是用于文件管理...

2018-12-05 13:11:17

阅读数 129

评论数 0

原创 【python pytorch】Pytorch实现逻辑回归

pytorch 逻辑回归学习demo: import torch import torch.nn as nn import torchvision.datasets as dsets import torchvision.transforms as transforms from torch.au...

2018-12-04 19:51:11

阅读数 218

评论数 0

原创 【python pytorch】Pytorch 基础知识

包含知识点: 张量 数学操作 数理统计 比较操作 #-*-coding:utf-8-*- import numpy as np np.set_printoptions(suppress=True) import torch # 构造一个4*5 的矩阵 z...

2018-12-03 19:42:30

阅读数 259

评论数 0

原创 【python pytorch】windows 10 深度学习框架pytorch安装

Python3.5+pip安装cpu版本 pip install http://download.pytorch.org/whl/cpu/torch-0.4.0-cp35-cp35m-win_amd64.whl pip install torchvision Python3.6+pi...

2018-12-03 11:54:52

阅读数 418

评论数 0

提示
确定要删除当前文章?
取消 删除