自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 Linux下时间相关函数

asctime(将时间和日期以字符串格式表示)  相关函数time,ctime,gmtime,localtime 表头文件#include<time.h> 定义函数char * asctime(const struct tm * timeptr); 函数说明asctime()将参数timeptr所指的tm结构中的信息转换成真实世界所...

2010-12-20 16:00:52 129

Linux系统下不同机器之间拷贝文件的方法

在Linux系统下,不同机器上实现文件拷贝 一、将本地文件拷贝到远程机器: scp /home/administrator/news.txt root@192.168.6.129:/etc/squid其中:/home/administrator/      本地文件的绝对路径news.txt                          要复制到服务器上的本地文件root ...

2010-09-17 18:34:40 261

Linux系统中如何使用解压缩命令

linux环境下,使用tar命令来实现文件和目录的解压缩,下面是tar的具体用法:参数: -c:创建一个压缩文件/目录-x:解开一个压缩文件/目录-t 查看 压缩文件/目录里面的文件-z:是否同时具有gzip 的属性?亦即是否需要用 gzip 压缩? -j:是否同时具有bzip2 的属性?亦即是否需要用 bzip2 压缩? -v:压缩的过程中显示文件-f:使用文件/目录名,在f之后要立...

2010-09-17 18:22:22 122

如何让putty支持中文

langiner@gmail.com 由于putty是老外开发的,对于中文支持不太友好,在缺省情况下,putty不能正常显示汉字,可以通过如下方式让putty显示汉字(无论在shell状态还是在vi/vim环境中) 1) 将putty字体设置为Fixedsys,并将字符集设置为CHINESE_GB2312。操作方式如下: 打开putty主程序,选择window-〉Appearanc...

2010-09-14 11:36:12 1116

如何在Linux系统实现字符编码转换

在Windows系统,可以利用WideCharToMultiByte和MultiByteToWideChar进行各种编码之间的转换比如WideCharToMultiByte(CP_ACP,0,pszWText,wcslen(pszWText),pszAText,nATextLen,NULL,NULL);将Unicode的pszWText转换为GB2312的pszAText,其中CP_ACP为编...

2010-09-08 16:21:49 231

Linux 输出输入重定向解决方案

Linux 输出输入重定向解决方案langiner@gmail.com Linux输入输出重定向用符号<和>来表示。0、1和2分别表示标准输入、标准输出和标准错误信息输出,可以用来指定需要重定向的标准输入或输出,比如 2>a.txt 表示将错误信息输出到文件a.txt中。同时,还可以在这三个标准输入输出之间实现重定向,比如将错误信息重定向到标准输出,可以用 2...

2010-09-08 13:43:56 94

alias作用

alias 设置指令的别名。用法:alias[别名]=[指令名称]用户可利用alias自定指令的别名。若仅输入alias,则可列出目前所有的别名设置。 alias的效力仅及于该次登入的操作。若要每次登入是即自动设好别名,可在.profile或.cshrc中设定指令的别名。若不加任何参数,则列出目前所有的别名设置。   ...

2010-09-06 10:43:40 563

原创 CRF中文分词开源版发布啦

langiner@gmail.com中文分词是互联网应用不可缺少的基础技术之一,也是语音和语言产品必不可少的技术组件。 自2003年第一届国际中文分词评测以来,由字构词的分词方法获得了压倒性优势,国内主要通过CRF++开源软件包来学习该分词方法,但是CRF++过于复杂的代码结构,导致了该算法的普及率。本次首先发布了CRF中文分词开源版(http://xiazai.zol.com.cn/detail/41/407136.shtml)仅仅包含CRF++软件包中分词解码器部分,简化了CRF++复杂代码结构,清除了

2010-09-02 20:47:00 253

如何高精度计算任务的运行时间

前言: 对于应用系统中频繁用到的核心算法,我们往往需要比较精确计算出该算法时间代价,本人通过查阅各种资料,发现以下方法是精度极高的时间计算方法: 几个基本概念: 秒(s) 毫秒(ms) 微秒(us) 纳秒(ns)1s = 1000ms1ms = 1000us1us = 1000ns对于精确度要求高的定时操作,则应该使用QueryPerformanceFrequency()和QueryP...

2010-09-02 16:01:05 472

LInux系统中文件内容统计和字符串查找

Linux 文件内容统计命令wc,可以统计文件行数、字节数、其中字数是由空格字符区分开的最大字符串语法:wc [选项] 文件…该命令各选项含义如下:  - c 统计字节数  - l 统计行数  - w 统计字数说明:这些选项可以组合使用 输出列的顺序和数目不受选项的顺序和数目的影响总是按下述顺序显示并且每项最多一列例如:$ wc - lcw file1 ...

2010-09-02 12:01:33 371

原创 向用户、竞争对手学习,是360的微创新之源-周鸿祎

现在,我说一说360的微创新,这是我这么多年来做互联网产品的一个总结,对我来说是方法论,我希望很跟朋友们分享,切磋。我记得比尔-盖茨有一句话,大意是他愿意为微软一直服务下去,因为他喜欢跟一群聪明人打交道。跟聪明人在一起交流是快乐的,大家都是聪明人,大拿不少,即使拍砖也能拍出水平。闲话少叙,言归正传。但提前说明一下,这篇博文牵涉到一些产品功能,不感兴趣的同志可以掠过。2008年7月,我们...

2010-09-02 11:17:55 119

如何在Linux实现计划任务

在Windows系统下,可以通过设置计划任务,让该任务按照设定的时间启动运行,解决了人工干预的烦恼,在Linux下也有类似的功能,它就是crontab crontab是什么crontab可以让使用者在固定时间或固定间隔执行程序之用,换句话说,也就是类似使用者的时程表。它是linux系统下一个自动执行指定任务的系统程序。例如,你想在每晚零时开始让爬虫抓取网页,就可以用cron来自动执行。...

2010-08-31 19:35:52 110

Linux SVN操作

SVN介绍SVN与CVS类似,主要用于版本控制 下载在 http://subversion.tigris.org 可以下载最新的SVN版本,最好下载Subversion-1.3.1.tar.gz(该版本比较稳定) 解压:tar zxvf subversion-1.3.1.tar.gz 生成Makefile文件:./configure 编译:make...

2010-08-31 16:15:01 87

史上超强图像处理开源工具包--ImageMagick

史上超强图像处理开源工具包--ImageMagicklanginer@gmail.com ImageMagick简要介绍ImageMagick是一套功能强大、稳定而且免费的工具集和开发包。可以用来读、写和图像格式转换,可以处理超过100种图像格式,包括流行的TIFF, JPEG, GIF, PNG, PDF以及PhotoCD等格式。对图片的操作,即可以通过命令行进行,也可以...

2010-08-26 18:27:23 1627

早日实现退休理想的N条军规

早日实现退休理想--你需要眼光和资格langiner@gmail.com 要早点退休,没有办法,除非早日获得财务自由。说来说去,还是个钱字。获得钱的路子很多,要合法的多赚钱,谋个好职位、打份好工是条路子。 怎么才能谋个好职位呢?首先,得搞明白什么样的职位算是个好职位;然后你的让自己有足够的资格去谋取那个职位。 一、关于什么样的职位算好职位1.找一家好公司什么是好...

2010-08-25 07:11:34 104

CRF中文分词开源版发布啦

CRF中文分词开源版发布啦langiner@gmail.com 中文分词经过艰苦的研发,终于发布了。 中文分词是互联网应用不可缺少的基础技术之一,也是语音和语言产品必不可少的技术组件。 自2003年第一届国际中文分词评测以来,由字构词的分词方法获得了压倒性优势,国内主要通过CRF++开源软件包来学习该分词方法,但是CRF++过于复杂的代码结构,导致了该算法的普及率。 本...

2010-08-24 17:15:13 72

又好又快的极速分词2.0

极速分词免费Windows版 langiner@gmail.com 又快又好的中文分词引擎 中文分词是互联网应用不可缺少的基础技术之一,也是其他语音和语言产品必不可少的技术组件。 经过连续多届国际中文分词评测,由字构词的分词方法获得了压倒性优势,极速分词采用由字构词技术路线,同时优化了分词速度,使得极速分词引擎具备了分词速度快和分词精度高的双重优势。 免费版性能指标 分词速度:350-500万字每秒,该速度远远超过目前商用分词的速度 分词精度:免费版仅仅使用200万字语料训练分词知识库,分词精度在95%左右,测试表明在保持速度的同时,可以通过增加训练语料规模,将性能提高到97%以上 测试环境:Intel 3GHZ CPU & 2G 内存 当前免费版仅仅包含基本分词功能,后续将继续推出免费的词性标注、关键词识别、新词识别;同时支持用户词典,任何问题和建议,可通过如下方式与作者联系 Email: langiner@gmail.com Blog: http://langiner.blog.51cto.com

2011-03-16

极速分词免费Windows版

极速分词:又快又好的中文分词引擎 中文分词是互联网应用不可缺少的基础技术之一,也是其他语音和语言产品必不可少的技术组件。 经过连续多届国际中文分词评测,由字构词的分词方法获得了压倒性优势,极速分词采用由字构词技术路线,同时优化了分词速度,使得极速分词引擎具备了分词速度快和分词精度高的双重优势。 免费版性能指标 分词速度:350万字每秒,该速度远远超过目前利用模型(如马尔科夫模型)进行分词的速度 分词精度:免费版仅仅使用200万字语料训练分词知识库,分词精度在95%左右,测试表明在保持速度的同时,可以通过增加训练语料规模,将性能提高到97%以上 测试环境:Intel 3GHZ CPU & 2G 内存 当前免费版仅仅包含基本分词功能,后续将继续推出免费的词性标注、关键词识别、新词识别;同时支持用户词典,任何问题和建议,可通过如下方式与作者联系 Email: langiner@gmail.com Blog: http://langiner.blog.51cto.com 更多信息参考官方下载: https://sourceforge.net/projects/crfdecoder/files/Faster-v1.0.rar/download 或者搜索 极速分词

2010-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除