自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (19)
  • 收藏
  • 关注

原创 wordnet

http://www.nltk.org/howto/wordnet.htmlWordNet InterfaceWordNet is just another NLTK corpus reader, and can be imported like this: WordNet的导入。from nltk.corpus import wordnetFor more compact code, we re

2016-01-18 17:00:46 3060

原创 单复数的转换

一个方案是pattern.en 自带的 singular一个方案是 inflect http://stackoverflow.com/questions/33972717/convert-plural-nouns-to-singular-nlp?rq=1

2016-01-18 12:10:53 4311

原创 命名实体的提取

一个是书上可能会有讲,论文里面应该也有涉及的时候,百度谷歌都可以上嘛。 nltk的库, nltk.chunk.conlltags2tree()是荷兰语的 nltk.ne_chunk()已经训练好了的,可以识别命名实体的分类器。

2016-01-18 09:48:29 1205

原创 抽空总结一下word2vec吧。

感觉做事情老不靠谱。 中文文档,这里有一个 word2vec的数学原理,百度文库。 讲得比较通俗吧。http://deeplearning4j.org/zh-word2vec.htmlhttps://www.zhihu.com/topic/19886836/top-answershttp://dataunion.org/10760.htmlhttp://itindex.net/detail/507

2016-01-13 20:22:52 619

原创 养成一些习惯

欢迎使用Markdown编辑器写博客我也不知道,感觉和各种人接触多了,对自己的积极影响还是蛮大的。一些要积极改变的东西。定时总结记录。一直都有懒惰的习惯啊。深入了解问题,而不是解决完一个问题就好,知其然,知其所以然,不然你以后还会遇到类似的坎。其实是和第一点是类似的。记得用谷歌兼容百度不要拒绝好用的工具。看官方文档有时候速度更快。像师姐那样迅速地尝试,而且也要敢去改别人的代码。不要畏难

2016-01-13 20:12:37 391

原创 treemap

http://mbostock.github.io/d3/talk/20111018/treemap.htmlhttp://bl.ocks.org/davetaz/9954190

2016-01-11 16:02:18 488

原创 js的效率问题

其实数据量多的时候,效率高低会影响交互。

2016-01-10 12:24:40 571

原创 英语断句

一种方式是利用nltk的断句功能 http://www.nltk.org/api/nltk.tokenize.html nltk.tokenize.punkt 模块断句的问题:简单的断句虽然可以利用一些标点符号断句,但是这里面有个问题是比如姓氏 Mr. Smith这样的句子,断句就会有问题。这个模块需要大的预料库进行训练 。 用法也很简单>>> import nltk.data>>> te

2016-01-07 22:09:40 2874

原创 numpy

import numpy as nplist 转 arraylist=[]a = np.array(list)array 转listb = a.tolist()

2016-01-05 22:23:00 583

转载 Markdown

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-01-05 22:20:50 327

Affinity_Propagation_(AP)_AP聚类聚类算法介绍

Affinity_Propagation_(AP)_AP聚类聚类算法介绍

2016-03-28

python emd算法

python emd算法 Earth Mover's Distance

2016-02-25

Interfacing C/C++ and Python with SWIG

Interfacing C/C++ and Python with SWIG

2015-12-01

sentiwords情感词

sentiwords情感词 【论文+(申请)下载:基于SentiWordNet的高准确率/覆盖率新情感词典SentiWords(155,286 words)】《SentiWords: Deriving a High Precision and High Coverage Lexicon for Sentiment Analysis》L Gatti, M Guerini, M Turchi (2015) http://t.cn/RUxgfXw project page:http://t.cn/RUxgVjT

2015-11-24

纯html写的大白

纯html写的大白,可以参考一些css属性的用法

2015-03-31

图片批量下载

这次因为要帮人找素材,http://ieeexplore.ieee.org 要帮找某个期刊的图片,这个期刊比较好的一点就是它把所有的论文图片都放在了网上,一个个链接打开太麻烦,所以就把东西全下下来了。 对于文章 http://blog.csdn.net/artemisrj/article/details/42434941

2015-01-05

问答网站样本

问答网站样本 ,单选题,填空题,多选题的判断

2014-12-20

改进的种子填充

改进的种子填充 processing 多边形填充

2014-06-03

斯坦福公开课机器学习基础文档

斯坦福公开课机器学习基础文档,包括各个课程的语言,以及一些笔记,和测试的东西

2014-02-07

范例啊XML关于语音识别语法部分

别人的一种XML格式

2013-07-28

图书管理系统借书还书续借罚金(JAVA+SQL2005)

图书管理系统借书还书续借罚金(JAVA+SQL2005)

2013-06-06

MFC视频播放MCI,mmsystem.h

MFC视频播放MCI,mmsystem.h,不过貌似只支持基本的无损压缩

2013-04-28

ActiveXWindowsMediaPlayer播放视频MFC

ActiveX Windows Media Player控件播放视频MFC

2013-04-28

音频播放器

可以选择播放速度,,简易音频播放,基于MFC对话框,编程语言为C++ directX 中directSound的支持

2013-04-26

Cohen-Sutherland算法实现直线裁剪

Cohen-Sutherland算法实现直线裁剪 单个CPP文件

2013-04-15

数据结构队列C++

数据结构队列数据结构作业,队列的相关操作

2012-12-09

十字链表数据结构

十字链表 理论有无线的长度,数据结构作业,

2012-12-09

数据结构,图

这个是数据结构的作业,包括图的定义和相关基本操作,都是自己写的,所以重合度不高

2012-12-09

数据结构,二叉树的应用

数据结构,二叉树的应用 定义了二叉树的结构 以及对它实现相关操作

2012-12-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除