- 博客(14)
- 资源 (7)
- 收藏
- 关注
原创 中文分词算法研究
分词算法有基于字典、基于规则和基于统计的,这里主要讲基于统计的方法。中文分词基本算法主要分类 中文分词算法总结介绍分词语料—— 中文分词入门之资源 互联网时代的社会语言学:基于SNS的文本数据挖掘字标注问题先看一个句子:我是一名程序员。将所有字分为4类,S表示单字,B表示词首,M表示词中,E表
2016-06-30 23:00:47 2919 1
原创 MEMM最大熵马尔科夫模型
HMM MEMM CRF 区别 联系HMM,MEMM,CRF模型的比较标记偏置 隐马尔科夫 最大熵马尔科夫 HMM MEMM
2016-06-30 22:45:25 4720
原创 多思考
说实话,我现在很少写文章。自初中开始我就讨厌写文章,讨厌为了应试必须在1个小时内写出一篇文章,然后交给别人评判你的文章打多少分,那种言之无物又必须绞尽脑汁把一篇文章凑足800字的一次次折磨让我对写作很是反感,所以高考过后我就很少写文章了。我学的理工科,本科时有大把的时间,但却没有把握好,浪费在了很多无谓的事情上。学的知识也大多和技术相关,政治、经济、法律、历史等等人文社科的书籍却读的不多,
2016-06-25 22:03:34 652 1
原创 leetcode 357. Count Numbers with Unique Digits
Given a non-negative integer n, count all numbers with unique digits, x, where 0 ≤ x n.Example:Given n = 2, return 91. (The answer should be the total numbers in the range of 0 ≤ x < 100, excludin
2016-06-21 21:33:42 643
原创 目标检测之CNN系列
排行榜pascal VOC:http://host.robots.ox.ac.uk:8080/leaderboard/main_bootstrap.phpcoco:http://mscoco.org/dataset/#detections-leaderboardkitti:http://www.cvlibs.net/datasets/kitti/eval_object.phpRegionlets ...
2016-06-20 08:33:56 12022 1
原创 centos添加第三方源
centos本身yum的软件源里缺少了很多软件,可以自行添加第三方源Linux环境:CentOS 7执行下述命令前,你可以先到/etc/yum.repos.d/目录下ls一下,看看它们长得是啥样子。1、安装epel和remi的repository:[root@localhost ~]#yum localinstall --nogpgcheck http://dl.fedor
2016-06-18 09:41:49 4626
原创 统计语言模型&word2vec
我们是这样理解语言的[我们是这样理解语言的-2]统计语言模型自然语言处理 - 语言模型(Language Modeling)NLP 学习笔记 01经典统计语言模型Statistical language model 统计语言模型语言模型n-gramn-gram语言模型NL
2016-06-16 22:43:53 1946
原创 LSA及pLSA
Introduction to Latent Semantic AnalysisLatent semantic analysis note(LSA)
2016-06-16 21:07:16 1193
原创 Collaborative Filtering协同过滤推荐算法
from math import sqrtdataset={ 'Lisa Rose': {'Lady in the Water': 2.5, 'Snakes on a Plane': 3.5, 'Just My Luck': 3.0, 'Superman Returns': 3.5, 'You, Me and Dupree':
2016-06-16 17:24:23 1191
原创 LeNet、AlexNet、VGG、ZF
LeNet5LeNet模型理解CIFAR10CIFAR10模型理解简述 AlexNetAlexNet 之结构篇 AlexNet 之算法篇AlexNet&Imagenet学习笔记CVPR 2015 之深度学习篇 Part 1 - AlexNet 和 VGG-NetAlex
2016-06-07 17:07:50 5026
原创 机器学习深度学习开源框架
都有python接口神经网络tensorflowtheanocaffechainer其他torch是lua语言机器学习dlibscikit-learn图像处理PILopencv矩阵/数值优化dlibnumpyscipy前面几个神经网络的基本都自带数值优化算法
2016-06-04 20:06:47 601
isodata聚类算法步骤说明
2015-10-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人