自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

呵呵

哈哈

  • 博客(4)
  • 资源 (15)
  • 收藏
  • 关注

原创 剑指offer - 第四题

在一个二维数组中,每一行都按照从左到右递增的顺序排序。每一列都按照从上到下递增的顺序排序。请完成这样一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。1 2 8 92 4 9 124 7 10 136 8 11 15如果查找数字是7, 返回true; 查找5返回false

2017-10-24 11:07:23 357

原创 文本挖掘 - 文档模型

文档模型,主要针对的是如何把文档数字化、向量化,最终可以利用这些文档来建立模型。当前文档模型主要包括三类:布尔模型,向量空间模型,概率模型。1. 布尔模型每个词在文档中出现则记为1,否则记为0。这样就可以将每一篇文章都转化为向量,这种方法非常简单易懂,但是会丢失很多重要信息,比如词组出现的次数。因为排除停用词(stop words)以外,一个单词在文章中出现次数较多,那么它相对来说也更重要

2017-10-24 09:43:32 1501

原创 文本挖掘 - 分词

分词即对词语进行划分。分词的基本方法包括:最大匹配法,最大概率分词法,最短路径分词法分词的难点:分词歧义,未登录词识别(冷启动)1. 最大匹配法最大匹配法实际上是一种贪心算法,它同时还利用现实中人们使用的词语长度都是在一个比较固定的范围内。利用这个长度的限制来逐步贪心。1.1 正向最大匹配算法从左到右截取词组并判断是否为一个词语。s: 待分的句子te

2017-10-18 21:02:54 1401

原创 文本挖掘 - 目录

开一个文本挖掘的专题,主要内容来自北京大学杨建武老师《文本挖掘》课程PPT。

2017-10-18 21:01:41 639

DBSCAN算法实现

DBSCAN算法实现

2017-08-14

聚类算法数据集

对聚类算法进行测试的数据

2017-08-14

svd计算例子

SVD分解计算方式

2017-08-10

PCA详细推导

PCA,主成分分析,详细推导。

2017-08-10

GMM高斯混合模型

高斯混合模型

2017-08-04

线性回归合集

线性回归,局部加权线性回归,ridge,lasso

2017-07-26

logistic回归推导

logistic回归,不再一头雾水

2017-07-14

图像处理功能集成

图像处理功能集成,集成了一些基本功能。

2016-12-23

PRML.pdf文档

PRML,机器学习Bible

2016-10-06

数字图像处理冈萨雷斯

数字图像处理冈萨雷斯matlab版

2016-10-06

学习OpenCV中文版

学习OpenCV中文版

2016-10-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除