自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一休哥的专栏

关注前沿,努力积累

  • 博客(97)
  • 资源 (6)
  • 收藏
  • 关注

原创 Java Maven项目打jar包方法

java maven项目打jar包

2022-09-22 10:07:38 1346

原创 英文词性标注PTB标准

词性 名称 英文解释 中文解释 例子及注解 CC 并列连词 Coordinating conjunction 并列连接词 and,but CD 基数词 Cardinal number 基数 one,4000 DT 限定词 Determiner 限定词 the, a EX 副词 Existential"there" 存在型there there FW 外来词 .

2022-04-11 16:08:13 801

转载 自然语言表示简史(BERT/ELMO/Word2vec/LDA/Bow/Ohehot,词向量、句向量、优缺点、应用与解决的问题)

本文链接:https://blog.csdn.net/rensihui/article/details/103284986收起一、自然语言表征与计算机表示自然语言是指一种人类社会中自然地随文化演化的语言,聪明的人类经过万年的积累,并通过后天良久的学习才能理解语言的魅力和含义,机械的计算机当然不能如此容易地表达出来。要了解自然语言的计算机表示,我们首先从发展、工业落地更加成熟的图像领域说起,图像使用非负数的矩阵表示像素点,是低层次的,连续的数据和特征。图像的任务,如分类...

2021-05-15 10:31:45 1119

原创 图片集合

2019-03-26 14:44:14 1308

原创 基于cnn和rnn的文本分类实践

本文主要介绍在文本分类中,使用CNN网络和RNN网络的实践,其中CNN又分为maxPool和k-maxpool。可以直接在juputer执行。代码已经上传githubhttps://github.com/yixiu00001/text-classify-cnn-rnn/blob/master/README.md1.CNN+maxPooltext-classification-cnn-maxpool...

2018-04-28 16:28:17 1881 1

原创 斯坦福 stanford coreNLP 中的PCFG parser-lexparser

PCFG模型训练Java -Xmx7g edu.stanford.nlp.parser.lexparser.LexicalizedParser -tLPP edu.stanford.nlp.parser.lexparser.ChineseTreebankParserParams -train data/source/dataCTBZh//bracketed -saveToSerializ...

2017-07-13 18:05:04 3205 2

原创 斯坦福大学Stanford coreNLP 宾州树库依存句法标注体系

斯坦福大学Stanford coreNLP 依存句法标注体系

2017-07-13 18:02:21 6302

原创 斯坦福stanford coreNLP 宾州树库汉语短语类别表23个

短语分类

2017-07-13 17:58:54 3709 2

原创 斯坦福Stanford coreNLP宾州树库的词性标注规范

宾州树库的词性标注规范

2017-07-13 17:57:01 7214

原创 stanford coreNLP CRFClassifier 模型加载和序列化

源代码位置:ie.crf.CRFClassifier模型加载loadClassifier(String loadPath, Properties props)/** * Loads a classifier from the file, classpath resource, or URL specified by loadPath. If loadPath ends in * .gz, us

2017-07-05 09:52:16 1742

原创 stanford CoreNLP 命名实体识别NER学习笔记

简介 识别文本的命名实体,如人名和机构名称等。每种语言识别出的实体是相互独立的,英文的识别集合比其他语言更为丰富。再NERClassifierCombiner中,会执行多个命名实体识别,然后将结果组合起来。识别类别       在英文中,命名实体识别能识别的名字包括:人名、地名、机构名、MISC;数字:钱、数字、序号、百分比;时间:日期,时间、持续序列、集合等实体。命名实体的识别使用组

2017-07-05 09:39:35 14740 2

原创 JAVA json转xml

https://mvnrepository.com/artifact/net.sf.json-lib/json-lib/2.4 目前最新的是2.4的版本,json-lib还需要以下依赖包: 通过mvn库可以直接去下载。 jakartacommons-lang 2.5 jakartacommons-beanutils 1.8.0 jakartacom

2017-05-24 17:17:17 4809

原创 推荐系统学习总结

推荐系统,用户行为数据,特征构建

2017-04-01 17:40:33 2826 1

原创 spark pipeline原理学习和记录

概念MLlib提供标准的机器学习算法API,能够方便的将不同的算法组合成一个独立的管道,或者叫工作流。 • DataFrame:ML API使用Sark SQL中的DataFrme作为机器学习数据集,可容纳各种类型的数据,如DataFrame可能是存储文本的不同列,特征向量,真正的标签或者预测。       • 转换器:Transformer是一种算法,可以将一个DataFrame转换成

2017-03-24 13:29:11 12060 1

转载 知识图谱研究进展

本文首先简要回顾知识图谱的历史,探讨知识图谱研究的意义。其次,介绍知识图谱构建的关键技术,包括实体关系识别技术、知识融合技术、实体链接技术和知识推理技术等。然后,给出现有开放的知识图谱数据集的介绍。最后,给出知识图谱在情报分析中的应用案例。— 漆桂林、高桓、吴天星 东南大学计算机科学与工程学院本文节选自《情报工程》2017 年第 1 期,知识图谱专题稿件。1 知识图谱构建技术本节首先给出知识图谱的

2017-03-22 13:29:06 7355

原创 Introducing the Knowledge Graph: things, not strings【阅读翻译】

ntroducing the Knowledge Graph: things, not strings【阅读翻译】

2017-03-22 10:34:10 7265

原创 网页数据构建知识图谱-数据和方法

1.网页数据解析 (1)可以参看webkit内核,构建一个网页解析工具,解析dom树/视觉树/分块树,根据需求解析目标数据; (2)构建xpath类规则,提取指定目标数据; (3)解析microdata数据,可以参考pps/babytree,里面的itemscope/itemprop系列标签2.数据来源 (1)百度百科/维基百科等知识词条类 (2)豆瓣类垂直站点 (3)其它类别的站点3.

2017-03-22 10:19:49 2485

原创 Cloudera数据科学平台Cloudera Data Science Workbench: Self-Service Data Science for the Enterprise

Cloudera Data Science Workbench: Self-Service Data Science for the Enterprise Cloudera数据科学工作台:企业自助数据科学开发环境March 14, 2017 R Python SCALA 使用

2017-03-16 10:01:19 2663

原创 SeetaFace中科院开源人脸项目Ubuntu下编译

SeetaFace 人脸引擎 ubuntu 14.04 编译执行

2016-12-07 14:54:47 7159 1

原创 python处理windows文本报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4

python处理windows文本报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4

2016-09-01 09:19:13 4059

原创 Win10下_findnext()调试时中断

系统重装升级到win10之后,在win7下面可以运行的文件夹遍历代码会中断。 ***** VIDEOINPUT LIBRARY - 0.1995 - TFW07 *****0x00007FFEC8614ECD (ntdll.dll) (demo.exe 中)处的第一机会异常: 0xC0000005: 写入位置 0x00000000036E0590 时发生访问冲突。0x00007FFEC8614

2016-08-31 16:34:36 5415

原创 R-CNN+SPP-NET+Fast-R-CNN+Faster-R-CNN+YOLO+SSD阅读笔记

RCNN系列+spp-net+yolo+ssd阅读笔记

2016-08-23 16:28:16 9101

原创 DeepID2+人脸识别算法学习

DeepID2+在DeepID2的基础上,继续对网络结构做了修改,同时增加了对卷积圣经网络的分析,发现了几个特征:(1)适度稀疏,及时将神经元二值化之后,认证效果依然很好;(2)选择性,高层神经元对认证对象具有高度敏感性,对于同一个人很多神经元会持续保持激活或者抑制状态;(3)和鲁棒性,对于水平遮挡或者随机块遮挡,具有较高的鲁棒性,及时只剩额头和头发,仍然可以达到88.2%的准确率。

2016-04-01 15:34:46 8811 2

原创 DeepID2人脸识别算法学习

DeepID2 验证信号 认证信号

2016-03-30 16:40:49 4288

原创 DeepId人脸识别算法学习

DeepID的目标是人脸验证(判断两张图片是否是一个人),同时衍生出人脸识别(多次人脸验证)。使用近期比较火的卷积神经网络学习特征,输入一张图片,产出160维的特征向量,然后使用现成的浅层机器学习组合贝叶斯进行分类。由于卷积神经网络计算的特征紧凑且区分度大,所以得到的效果较好。

2016-03-29 11:40:40 11250

翻译 一篇基于pthon和scikt-learn的关于机器学习的介绍

一篇基于pthon和scikt-learn的关于机器学习的介绍 ,监督学习,非监督学习,交叉验证

2016-03-15 14:21:24 5696

原创 Mat简介入门

opencv mat

2016-01-08 09:20:44 800

原创 C++矩阵处理工具Eigen类浅析

参考http://eigen.tuxfamily.org/dox/classEigen_1_1Matrix.html1.Matrix 矩阵矩阵类多用于单列vector和单行的vector,多用于密集型矩阵或者vectors容器。Vector是只有一列的矩阵,row-vector是只有一行的矩阵。可以定义为固定大小或者动态大小。templateclass Eigen::Mat

2015-12-03 14:44:36 2036

转载 人脸识别国内外现状及发展

分几个方面分别的论述一下人脸识别的技术和产业发展的相关状况。第一,人脸识别技术的价值在哪里。我们把人脸作为一个生物学特征,作为一个商业化运用,只是备选的一个方案之一。生物学当中,唯一的判断的标准,其实识别从精准度的角度和不可替代的角度来讲,最精准的是虹膜,但是虹膜的识别采集成本非常高,识别的效率相对不是很高,需要等待的时间。所以这两个条件约束了整个的产业化运用只能局限在相对小众的,对识别要

2015-05-11 14:09:45 49482 1

原创 opencv中PCA源码理解与训练、使用

/****************************************************************************************\* PCA *\*****************

2015-05-11 08:47:48 4455

转载 IplImage, CvMat, Mat 的关系和相互转换

opencv中常见的与图像操作有关的数据容器有Mat,cvMat和IplImage,这三种类型都可以代表和显示图像,但是,Mat类型侧重于计算,数学性较高,openCV对Mat类型的计算也进行了优化。而CvMat和IplImage类型更侧重于“图像”,opencv对其中的图像操作(缩放、单通道提取、图像阈值操作等)进行了优化。在opencv2.0之前,opencv是完全用C实现的,但是,IplIm

2015-04-03 10:39:15 467

转载 Deep Learning(深度学习)学习笔记整理系列

作者整理了很多深度学习的资料写成的学习笔记,非常适合初学者了解深度学习的概念和思想。转自:http://blog.csdn.net/zouxy09/article/details/8775360目录:一、概述二、背景三、人脑视觉机理四、关于特征       4.1、特征表示的粒度       4.2、初级(浅层

2015-04-02 10:21:09 1615

转载 卷积的有意思解释

最幽默的解释 卷积的物理意义 谈起卷积分当然要先说说冲击函数—-这个倒立的小蝌蚪,卷积其实就是为它诞生的。”冲击函数”是狄拉克为了解决一些瞬间作用的物理现象而提出的符号。 古人曰:”说一堆大道理不如举一个好例子”,冲量这一物理现象很能说明”冲击函数”。在t时间内对一物体作用F的力,我们可以让作用时间t很小,作用力F很大,但让Ft的乘积不变,即冲量不变。于是在用t做横坐标、F做纵坐标的坐标系

2015-03-30 17:32:01 752

原创 记录

http://blog.csdn.net/smartempire/article/details/23377385

2015-03-20 17:50:16 433

翻译 openbr简介

OpenBR [3] is a framework for investigating new modalities, improving existing algorithms, interfacing with commercial systems, measuring recognition performance, and deploying automated biometric s

2015-03-19 11:17:39 2727

原创 增强现实初始

增强现实,AR(AugmentedReality),从字面理解,即在人们的现实生活场景中叠加虚拟信息,达到对现实世界信息丰富和扩张的效果。1.增强现实的历史人们对增强现实的研究是从1990年代初期开始,当时需要昂贵的硬件设备。初期主要实现方式采用HMD(Head Mounted Display)。随着个人电脑的性能不断改进,2007年左右AR的概念开始逐渐的在专门的研究者之外流传开来。

2015-03-05 09:21:55 1134

转载 人工智能的冬天【杨强】

杨强:香港科技大学计算机系主任,华为诺亚方舟实验室主任在2015年的冬季达沃斯会议上,一个著名的中国企业家在中国之夜的聚会上正好坐在我对面。 他早上的时候就坐在我们有关人工智能演讲的会场里。看来, 他仍是意犹未尽,因为他问我问题的时候,眼睛好像在放着光:“我们离人工智能到底有多远?计算机究竟会不会做梦呢?”的确,计算机有没有智能和情感, 会不会做梦,能不能有一天与人

2015-02-26 16:19:10 1629

原创 深度学习初识(1)

1.深度学习从生命的生物机理中获得灵感,但是它与大脑的工作原理差别非常巨大。2.描述深度学习:(1)学着描绘世界的机器(machines that learn to represent the word);端对端的机器学习(end-to-end machine learning)。在一个能够学习的机器中,每一个组件、每一个阶段都能进行训练。3.可以把深度学习看成是,通过整合大量能够基于相同

2015-02-26 10:02:21 894

翻译 Storm DRPC

Distributed RPCThe idea behind distributed RPC (DRPC) is to parallelize the computation of really intense functions on the fly using Storm. The Storm topology takes in as input a stream of functio

2015-02-10 14:24:10 532

转载 storm UI 解释【转】

Storm UI本文主要解释下storm ui上各项属性的含义。1. mainpage    首页主要分为3块:    a. Cluster Summary    Nimbus uptime: nimbus的启动时间    Supervisors: storm集群中supervisor的数目    used slots: 使用了的slots数

2015-01-28 15:52:56 499

2014年第33次中国互联网络发展状况统计

2014年第33次中国互联网络发展状况统计

2014-08-12

pku98-人民日报分词语料1998年1月份

人民日报分词语料1998年1月份,包含训练和两份语料和汇总语料,可以自行训练和验证模型使用。

2020-11-09

汉字编码一级字库

一级汉字库

2016-06-14

g2pv.json测试数据源文件

g2pv.json数据可以用于展现前端词云,2.经过一番百度谷歌终于找到G2, 参照官网的例子 https://antv.alipay.com/g2/doc/tutorial/advance/draw-word-cloud.html 3.G2可以根据给定图形生成词云,所以就能够生成自己想要的词云,注意给定的模板图片一定要轮廓分明,最好是外围都是白色

2019-03-26

八爪鱼安装包

八爪鱼安装包,可定制,使用方便,门槛低。

2018-11-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除