自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 资源 (3)
  • 收藏
  • 关注

转载 大哉,计算语言学之为用!(冯志伟)

采用计算机技术来研究和处理自然语言是20世纪40年代末期和50年代才开始的,60多年来,这项研究取得了长足的进展,成为了现代语言学中一门重要的新兴学科,叫做“计算语言学”(ComputationalLinguistics,简称CL),这门学科同时也属于计算机科学的一个分支,叫做“自然语言处理”(Natural LanguageProcessing,简称NLP)。   我认为,计算机对自然语言的

2012-12-24 09:30:47 1933

原创 面向对象编程强调抽象、封装、继承、多态

抽象:我们在定义一个抽象类的时候,实际上就是把一类事物共有的属性和行为提取出来,形成一个物理模型(模版),这种研究问题的方法称为抽象。你可以这样来想,抽象就是一个类的最基础的东西,比方说人,他的抽象类可能就是都从母体出来,有皮肤。但具体到你是黑人,白人,还得黑人类,白人类来说明 。封装:就是将类的属性包装起来,不让外界轻易的知道他的内部实现。只提供给你对外的接口让你来调用。好处可以增强

2012-12-23 22:10:34 607

原创 随笔2012-12-23

1. malloc 函数原理:函数原型:extern void *malloc(unsigned int num_bytes);原理:malloc函数的实质体现在,它有一个将可用的内存块连接为一个长长的列表的所谓空闲链表。调用malloc函数时,它沿连接表寻找一个大到足以满足用户请求所需要的内存块。然后,将该内存块一分为二(一块的大小与用户请求的大小相等,另一块的大小就是剩下的字节)。接下

2012-12-23 20:22:29 488

原创 编辑距离

做文本分析的时候,我们常常需要计算两篇文本的相关性(相关性除了可以使用相似度还可以使用距离-当然是应该反着来算的),如果你不知道把文本转换为一个向量(如果你知道这个,那遭了,因为那样你就可能认为我这里的很rubbish了),那你可能会考虑我们这里介绍的最朴素的方法-计算字符串间编辑距离的方法。         先给出我遇到的问题(也即定义编辑距离):设A 和B 是两个字符串。对于字符串可以

2012-12-23 10:31:00 794

原创 java序列化与反序列化总结

很多商业项目用到数据库、内存映射文件和普通文件来完成项目中的序列化处理的需求,但是这些方法很少会依靠于Java序列化。本文也不是用来解释序列化的,而是一起来看看面试中有关序列化的问题,这些问题你很有可能不了解。“Java序列化指的是将对象转换程字节格式并将对象状态保存在文件中,通常是.ser扩展名的文件。然后可以通过.ser文件重新创建Java对象,这个过程为返序列化”Java序列化的AP

2012-12-23 09:54:31 3503 2

原创 java 序列化与反序列化(二)

这次我们讲的是控制对象的序列化和反序列化 控制序列化就是有选择的序列化对象,而不是把对象的所以内容都序列化,前篇我们的例子中介绍了transit变量和类变量(static)不被序列化,现在我们还有一种更为灵活的控制对象序列化和反序列方法,可以在序列化过程中储存其他非this对象包含的数据 我们现在再来介绍一个接口 java.io.Externalizable 。当对

2012-12-23 09:51:50 872

原创 java 序列化与反序列化(一)

在JAVA中,一个大的应用程序需要保存很多对象的时候,由于虚拟机内存有限,有时不可能所有有用的对象都放到内存中,因此,需要将不常用的对象暂时持久化的文件中,当需要这个对象时,再从文件把对象恢复到内存中,这就是所谓对象的序列化和反序列化。本文讲实现如何将对象序列化到文件,然后再从文件反序列化到对象,你会发现其实特别简单 先看一下对象的序列化和反序列化的关键是什么1,首先被序列

2012-12-23 09:46:11 2316

原创 求排序数组的元素的绝对值的最小值

题目:一个有序数组(从小到大排列),数组中的数据有正有负,求这个数组中的最小绝对值。思路:一个简单的思路,就是一次性遍历数组,求出数组的元素的绝对值的最小值,这样的时间复杂度为O(n)。但是,这样就浪费了题目的一个条件:数组是已经排好序的。所以,需要对原来的题目进行转换。考虑到数组有序,则元素绝对值的最小值为数组中最大负数的绝对值与最小非负数的绝对值的最小值。于是,题目事实上是去查找原数组

2012-12-21 16:19:01 2379

原创 各类二叉树

1.二叉树重要性质:性质1:在二叉树的第i层上至多有2^(i-1)个节点(i >= 1)性质2:深度为k的二叉树至多有2^(k-1)个节点(k >=1)性质3:对于任意一棵二叉树T而言,其叶子节点数目为N0,度为2的节点数目为N2,则有N0 = N2 + 1。性质4:具有n个节点的完全二叉树的深度 。性质5:一棵完全二叉树,其深度为 ,节点编号按层编号,每层从左至右编号,则

2012-12-21 15:56:42 738

原创 函数strcpy和函数memcpy

内存重叠:拷贝的目的地址在源地址范围内。所谓内存重叠就是拷贝的目的地址和源地址有重叠。在函数strcpy和函数memcpy都没有对内存重叠做处理的,使用这两个函数的时候只有程序员自己保证源地址和目标地址不重叠,或者使用memmove函数进行内存拷贝。memmove函数对内存重叠做了处理。现在来看函数strcpy原型:extern char *strcpy(char

2012-12-21 15:17:25 830 1

原创 java随机函数用法Random

import java.util.Random;public class RandomNumber{public static void main(String[] args) {// 使用java.lang.Math的random方法生成随机数System.out.println("Math.random(): " + Math.random());// 使用不带参数的构造方法

2012-12-21 10:42:31 806

原创 相似度计算常用方法综述

引言       相似度计算用于衡量对象之间的相似程度,在数据挖掘、自然语言处理中是一个基础性计算。其中的关键技术主要是两个部分,对象的特征表示,特征集合之间的相似关系。在信息检索、网页判重、推荐系统等,都涉及到对象之间或者对象和对象集合的相似性的计算。而针对不同的应用场景,受限于数据规模、时空开销等的限制,相似度计算方法的选择又会有所区别和不同。下面章节会针对不同特点的应用,进行一些常用的相

2012-12-14 08:45:23 21099

原创 sort

sort是在Linux里非常常用的一个命令,管排序的,集中精力,五分钟搞定sort,现在开始!1 sort的工作原理sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。[rocrocket@rocrocket programming]$ cat seq.txtbananaapplepearoran

2012-12-07 16:48:02 655

原创 修改mysql默认编码方式

MySQL的默认编码是Latin1,不支持中文,要支持中午需要把数据库的默认编码修改为gbk或者utf8。 1、需要以root用户身份登陆才可以查看数据库编码方式(以root用户身份登陆的命令为:>mysql -u root –p,之后两次输入root用户的密码),查看数据库的编码方式命令为: >show variables like 'character%';+-----------

2012-12-06 10:52:33 585

转载 ubuntu mysql卸载与重装

1、删除 mysql1 sudo apt-get autoremove --purge mysql-server-5.02 sudo apt-get remove mysql-server3 sudo apt-get autoremove mysql-server4 sudo apt-get remove mysql-common (非常重要)上面的其实有一些是多余的,建议还是按照顺

2012-12-06 09:57:40 2957

lucene2.9.4

lucene2.9.4官方版本 很好用的 我自己现在就在用 给大家分享一下吧

2012-03-05

学生选课系统

自己做的网上选课系统 给大家分享,基本的功能都包括了。

2011-12-13

个人的总结的Eclipse快捷键集合希望对大家有用

个人的总结的Eclipse快捷键集合希望对大家有用

2011-12-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除