自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

赖德发的博客

征途路上,星辰大海,交流微信:laidefa

  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 【python 走进NLP】LCS算法最长公共子串

输入两个字符串,求它们的最长公共子串。注意,并不要求字符必须连续出现。 例子: 字符串A=kitten,字符串B=sitting 那他们的最长公共子串为ittn # -*- encoding=utf-8 -*- import numpy as np def LCS(x,y): c=np.zeros((len(x)+1,len(y)+1)) b=np.zeros((len(x)+...

2019-03-28 11:15:28 665 1

原创 【java 走进NLP】最长公共子串LSC算法

最长公共子串(LCS),有三种情况: 1.公共子串的元素必须相邻 2.公共子串的元素可以不相邻 3.求多个字符串而不是两个字符串的最长公共子串。 情况1:公共子串的元素必须相邻 解决方法是采用一个矩阵来记录两个字符串中所有位置的两个字符之间的匹配情况,若是匹配则为1,否则为0。然后求出对角线最长的1序列,其对应的位置就是最长匹配子串的位置。例如:A串作为x轴,B串作为y轴,矩阵对应位置表示两个字符...

2019-03-28 10:53:25 822

原创 【python 走进NLP】keras情感分析例子

情感分析是自然语言处理很重要的一个方向,目的是让计算机理解文本中包含的情感分析。在这里将通过IMDB收集的对电影评论的数据集,分析某部电影是一部好电影还是一部不好的电影。借此研究情感分析的问题。 1、在这里直接使用keras的imdb.load_data() 函数导入数据。 2、keras通过嵌入层(Embeding)将单词的正整数表示转换为词嵌入。嵌入层需要指定词汇大小预期的最大数量,以及输出的...

2019-03-13 12:02:17 1605

原创 【python 编码问题】UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-4: ordinal not

先说解决办法: python2.7版本,在开头加入下面语句 import sys reload(sys) sys.setdefaultencoding('utf-8') python3.x 版本,在开头加入下面语句 import importlib importlib.reload(sys) 原因解释: 1、这个问题是由于Unicode编码与ASCII编码的不兼容造成的。 2、通常都是asci...

2019-03-12 16:56:39 6239

gbdt和xgboost算法详解

该文档详细介绍了机器学习算法中的GBDT和XGboost 两大神器

2018-01-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除