自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(16)
  • 资源 (3)
  • 收藏
  • 关注

原创 中文分词技术综述

2019-03-06 15:28:26 378

原创 fedora 27字体美化达到ubuntu级别

1.添加freetype-freeword源,并yum安装2.安装一些windows,ubuntu字体,如方正字体,汉仪字体,微软字体,到/usr/share/fonts3.拷贝ubuntu下的/etc/fonts 去替换fedora下的/etc/fonts4.安装gnome-tweak-tool并调整字体,如修改字体为方正隶变,汉仪小隶,等宽变为couriew系列4.重启...

2018-04-24 12:08:20 1011

原创 关于自然语言理解的一些理解

1)自然语言不仅仅应当看做简单的数据,它更应当看作是"人脑"这台机器的“程序”;(当下的很多方法忽略了语言的控制功能只看到了信息承载功能)2)机器是靠着编译器解释执行程序的,自然语言是是否也存在着翻译过程,而后是理解与执行过程呢3)程序与机器结构是一体的,自然语言是否也无法脱离人脑结构?自然语言理解的过程:  语言--》通过已有的知识体系与偏好进行翻译--》根据对应的信

2017-12-13 19:23:32 5685

原创 Everything To Byte And To Tensor -- Welcome to age of AI

本文是一篇关于AI时代的软硬件组织形态的思考,关于AI时代我们应该如何重新定义我们的数据、硬件和软件的思考。为了避免误解这里把传统的软件和互联网时代称为PC时代,而与之相对应的以深度学习为主的时代称为AI时代.(本文不是严谨的科学论述,是对行业的一些思考的总结)    不管是过去还是未来,信息处理围绕的核心始终是数据,这里先从数据开始谈起,并围绕着数据这一核心进行展开论述。    PC

2017-12-06 19:05:48 283

原创 关于自然语言产生机制的理解以及对抗网络机器学习的应用(想法记录)

众所周知自然语言的产生遵循交流的省力原则,也既A与B,对话过程中A-->需要用最小的符号表达最清楚的含义B->明确的理解A的含义也就是说语言的发展是一个对抗网络的训练过程整个对抗网络如下:A: 观点-->语法结构-->顺序语言B: 顺序语言-->语法结构-->观点训练目标如下:整个网络保证A-B的观点相差最小化A要说明意图的情况下尽量

2017-01-12 17:13:46 494

原创 霍夫曼编码c++

/* * huffman.c * 霍夫曼编码代码 * Created on: Dec 12, 2016 * Author: xuenhappy * * sample: *============input file:============t 2h 1i 2s 2_ 7a 4n 2e 4x 1m 2p 1l 1o 1f 3

2016-12-13 10:47:23 704

原创 数的变换操作(Baidu的一道)

最近在网上看到百度的一道面试题,全文如下:定义自然数上的操作,如果这个数是偶数则除以2,奇数则加1或者减1,求把一个大于1的数变成1,所需的最少步骤。例如:5  操作如下5-1=4  4/2=2   2/2=1           这里有两个思路一个是递归,一个是基于数的二进制表示,整个题意的大致思想就是用最少的操作把一个数的所有比特位除却最高位外都变为零。依据这两种思路给出如下代码:

2013-12-18 12:39:26 611

原创 论分类(三)-感知器篇(续)

刚才我们领略了感知器分类的能力,并且提到了感知器的学习算法,对于这个算法是怎么样一步步具体来的有兴趣的朋友可以自己试着找下。但这里还有个问题,算法有个基本要求就是有穷性,但是上述所给的感知器算法会不会死循环一直进行下去呢,在这可以可以明确的告诉大家,算法在线性可分的情况下一定会停止的,具体证明过程可以参见有关书籍这里就不给出了。刚刚说在线性可分的情况下感知器就能区分出来我们要分类的数据,这也就是告

2013-07-06 16:35:25 747

原创 论分类(三)-感知器篇

前面说到了一个简单的可学习的分类数学模型-感知器。在这一节里就来具体说一下感知器是如何学习的以及它的能力有多大!首先明确一下条件,假设两类点集合A,B,感知器的参数为ω,b.学习的目的就是求一个满足ωT*Xa+b≥0,Xa∈A;ωT*Xb+b≥0,Xb∈B;聪明的朋友一眼就会发现他有可能有无数个解,话虽这么说但是求一个满足要求的解也不是那么容易的,在这我们给出一个Frank Rosenblat

2013-07-06 13:08:27 1736

原创 论分类(二)

上一节里我们说到我们可以利用可学习的数学模型进行分类,那么什么样的模型称为可学习的模型呢,是不是所有的东西都是可以被学习的呢(学习能力的极限)。首先我们来感性的的认识下这两个问题,设想一个猎犬在学习如何进行捕捉兔子,刚开始猎犬见到兔子就猛扑上去结果没抓住,后来猎犬慢慢学着先慢慢靠近兔子再突然上去抓结果就抓住了,在这个过程中,猎犬通过逐渐改变自己的行为来适应抓兔子这个过程,这也就说明了猎犬的行为存在

2013-07-05 14:47:44 636

原创 论分类(一)

在这里我们探讨的一个话题,分类。首先说下为什么要分类以及它的意义,在我们的世界里有很多不同的东西需要我们去研究,然而由于现实世界的纷繁复杂,千头万绪,我们很难一下子看出所有事物的特性,为了降低我们的研究事物的难度,也为了能够更好的认清事物,我们对世界上的东西进行了分门别类的研究处理,打个比方,例如生物学上,我们把生物分成了,原核生物、真核生物、病毒,而后针对每样事物进行研,由于同一类别的事物有他们

2013-07-05 11:31:32 638

转载 Lucene 3.0 原理与代码分析

本系列文章将详细描述几乎最新版本的Lucene的基本原理和代码分析。其中总体架构和索引文件格式是Lucene 2.9的,索引过程分析是Lucene 3.0的。鉴于索引文件格式没有太大变化,因而原文没有更新,原理和架构的文章中引用了前辈的一些图,可能属于早期的Lucene,但不影响对原理和架构的理解。本系列文章尚在撰写之中,将会有分词器,段合并,QueryParser,查询语

2012-05-16 08:51:14 412

原创 一个数的分解方法(一道面试题)

题意要求:在满足的以上要求的情况下编程求解出给定一个数求解出所有的可能组合。例如:输入10,则应该返回:1+9=102+8=103+7=104+6=101+2+7=101+3+6=101+4+5=102+3+5=101+2+3+4=10共计9条 求解过程:  拿到题目首先最直观的想法就是暴力求解,显然当给定的和数很大时这种方式将很

2012-05-15 17:06:52 1460 1

原创 本体库(理论篇)

本体库的概念              本体是一个哲学上的概念,哲学上它指的是人类能够理解的抽象事物(这里理解可能会有些不合理的地方,欢迎大家指正),但是计算机领域的本体指的是一些概念,概念间的关系,公理,以及实例的集合,可以理解为本体就是人类对事物的形式化的描述。由于世间万物种类繁杂,所以描述不同的事物的本体会有区别。例如描述一个生物的本体和一个描述社会关系的本体显然不会相同,物以类聚,这样

2012-05-14 11:09:16 4468

原创 ubuntu中常见的中文问题解决方法

ubuntu中常见的中文问题解决方法1.字体支持设置拷贝windows下的所有ttf到/usr/share/fonts下即可----------------------------------------------------------------------------------------------------------------------------------

2012-05-12 20:41:23 1532

原创 Linux/windows下java调用lingo

最近有一些朋友问我关于java程序调用lingo的问题,为了方便大家了解一些过程,下面就将java调用的详细过程重新写一下。在介绍java调用前首先介绍下,他们之间调用的原理。原理:一个完整的java-lingo程序,必须包含三个要素,java程序-model文件-lingo软件,这三这个缺一不可,并且model文件与java程序是相互对应的也就是说如果你修改了其中任何一个文件其他的文件也

2012-05-12 18:32:10 6136 8

模式识别图书

一本优秀的介绍模式识别的英文教材,对于需要模式识别,数据挖掘相关的研究人员或者学生有帮助!

2012-05-05

Dr.Explain(Chm帮助文件撰写工具)

是一个优秀的编写软件说明文档的工具。它可以捕获活动应用软件的屏幕并且自动地添加参照加以控制。你可以通过添加标题和所需要的更多的注释完善参照。Dr.Explain将为你的应用软件创建一个带有屏幕截图、参照、菜单和一个索引页的指南。

2012-05-05

Mtlab/linux/unix2011a

linux下的matlab种子文件,速度不错,linux下matlab的能力才会正真的发挥出来!

2012-05-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除