- 博客(45)
- 资源 (4)
- 收藏
- 关注
原创 概率图模型【读书笔记2】linear-chain CRF to general CRF
1.We simply move from using a linear-chain factor graph to a more general factor graph, and from forward-backward to more general (perhaps approximate) inference algorithms(compute Z).
2011-01-25 23:01:00 2177
原创 概率图模型【读书笔记1】概率理论
对于概率probability的两种理解:(1)频率,frequencies of events,无法解决比如“明天下雨概率是0.8”,因为无法定义频率,明天只有一个。(2)信念的接受程度,subjective degree of belief.
2011-01-23 23:36:00 1385
原创 Ubuntu下将home的大小目录扩大
状况:当时给系统分区的时候,home和根目录都是25GB左右,突然发现home 目录不够用了,于是决定进行将根目录的部分空间挪移到home下去主要方法:使用Gparted的LIve USB的方法。方法:(1)按照前文所述的方法,构建一个usb(2)开机,启动,进入USB启动(我的是按住F12)(3)一直等到进入桌面部分(4)运行那个GPARTED,将根目录前边设置为13GB,调整后的大小相应减少13G(5)将home增加13GB,后边部分增加。(6)Apply,等待约1小时,进行迁移数据(7)done!
2011-01-22 14:53:00 10197 1
原创 LiveUSB for GPARTED的使用
USB setup with GNU/LinuxChoose one of the following methods to setup GParted Live on your USB flash drive using GNU/Linux:GNU/Linux Method A: TuxbootGNU/Linux Method B: ManualGNU/Linux Method C: UnetbootinGNU/Linux Method A: TuxbootDownload Tuxboot on your
2011-01-22 13:47:00 3443
原创 /r/n在windows和linux的区别
<br />/n 为ASCII的0x0a 换行 <br /><br />/r 为ASCII的0x0d 回车 <br /><br />在windows 系统中,当你输入回车时会自动变成/r/n <br /><br />在linux下的回车键只代表/n <br /><br />而在windows下的回车键表示/r/n <br /><br />/n为进入下一行,/r为打印头回到行首上 <br /><br />linux/unix下只用/n,它就表示回车+换行 <br />而windows下,/
2011-01-20 16:15:00 1733
原创 ubuntu下开启evolution邮件通知
使用mail-notification: sudo apt-get install mail-notification mail-notification-evolution
2011-01-17 11:12:00 2256
原创 C语言下载器支持断点续传和多线程
/* ============================================================================ Name : qdownload.c Author : Version : Copyright : Your copyright notice Description : Hello World in C, Ansi-style ============================
2011-01-15 21:28:00 1568
原创 Linux shell脚本的字符串截取
<br /><br />http://blog.csdn.net/gumanren/archive/2010/05/17/5601544.aspx<br />Linux 的字符串截取很有用。有八种方法。<br />假设有变量 var=http://www.hao.com/123.htm<br />.<br />.<br />一 # 号截取,删除左边字符,保留右边字符。<br />echo ${var#*//}<br />其中 var 是变量名,# 号是运算符,*// 表示从左边开始删除第一个 // 号及左边
2011-01-13 16:33:00 1004
原创 shell读取文件的一行
<br />转载 shell脚本:一次读取文件的一行,并输出 收藏 <br />写法一: <br />#!/bin/bash <br />while read line <br />do <br /> echo $line #这里可根据实际用途变化 <br />done < urfile <br /><br /><br />写法二: <br /><br />#!/bin/bash <br /><br />cat urfile | while read line <br />do <br
2011-01-13 16:07:00 1356
原创 ubuntu设置变暗时间
<br />在系统-首选项-电源设置 里,AC,和电池项下各有一个设置dim display when idle。不过里面不能设置时间。要设置时间,需要在terminal里输入,gconf-editor然后找到apps > gnome-power-manager > backlight > idle_dim_time可以看到idle_dim_time默认是30秒,可以自己设置成更长的时间。
2011-01-12 21:04:00 1506
原创 linux编译自己的lib库
<br />目录结构:src中存放源代码,lib中存放lib文件,比如hash_table,queue等,test存放test代码。<br />首先在src中新建Makefile.am:<br />AUTOMAKE_OPTIONS=foreignINCLUDES=-I../libbin_PROGRAMS=programprogram_SOURCES=program.cprogram_LDADD=$(top_srcdir)/lib/libcqby.a <br />在lib中建立Makefi
2011-01-11 00:11:00 2997
原创 LInux下的有道词典
<br />#! /usr/bin/pythonimport re;import urllib;import urllib2;import sys;def debug(): xml = open("word.xml").read(); print get_text(xml); print get_elements_by_path(xml, "custom-translation/content"); #print_translations(xml, False, Fals
2011-01-10 17:05:00 6274 2
原创 改造以及教训
<br />C的指针,真是很怪异的说,一定要记得传递指针与寄存器变量和malloc的变量的区别,弄了一天,终于改造了一下,将HashTable用到了系统中。<br />
2011-01-09 19:27:00 875
原创 2010年10大热门的开源NoSQL服务器软件
<br /><br />NoSQL,就是反SQL,是一项全新的数据库革新运动,特别是在 2010 年得以迅猛发展。而各种开源的 NoSQL 软件突然间涌现在你面前。目前似乎没有对 NoSQL 给出一个标准的定义,也没有相应的规范,但从这些软件可以看出 NoSQL 软件的共同点:独立运行、K/V存储结构,这之前有人称之为集中式缓存服务,其实你可以把二者等同起来。<br />那么多的 NoSQL 软件,到底哪些更受欢迎呢?为此,开源中国社区为你评选出10款2010年最受关注的 NoSQL 软件。<br />1.
2011-01-08 22:30:00 934
原创 latex安装sty文件
<br />1.在一些latex中使用的怪异的package,一般是不自带的,可以去CTAN下载。地址为:ftp://ftp.ctex.org/CTAN/macros/latex<br />2.比如我要下载 /usepackage{listings},则找到该sty文件,下载到本地,解压;<br />3.传送到latex的目录:sudo mv /home/qibaoyuan/listings /usr/share/texmf-texlive/tex/latex/<br />4.然后进入: /usr/sha
2011-01-08 16:58:00 17750 2
原创 使用 Makefile
<br /> 利用 configure 所产生的 Makefile文件有几个预先设定的目标可供使用,这里只用几个简述如下:<br /><br /> make all:产生设定的目标,既次范例中的执行文件。只敲入make 也可以,此时会开始编译源代码,然后连接并产生执行文件。<br /><br /> make clean:清除之前所编译的执行文件及目标文件(object file, *.o)。<br /><br /> make distclean:除了清除执行文件和目的文件以外,也把 con
2011-01-08 15:46:00 1314
原创 automake的过程
1.建立目录结构,如目录为work,子文件夹src2.在src首先写好自己的c文件和h文件,并明确调用关系,然后在src中建立Makefile.am文件,重点!Makefile.am的格式:Makefile.am 文件定义所要产生的目标: AUTOMAKE_OPTIONS:设置 automake 的选项。Automake 主要是帮助开发 GNU 软件的人员来维护软件,所以在执行 automake 时,会检查目录下是否存在标准 GNU 软件中应具备的文件,例如 NEWS、AUTHOR、ChangeL
2011-01-08 15:37:00 830
原创 configure.scan的修改
<br /><br />autoscan以后会生成configure.scan,然而下一级aclocal需要的是configure.in<br />因此,mv configure.scan configure.in<br />然后修改:<br />在其中添加如下黑色部分:<br /> <br />AC_PREREQ([2.67])<br />AC_INIT([FULL-PACKAGE-NAME], [VERSION], [BUG-REPORT-ADDRESS])<br />AM_INIT_AUTOMAKE(
2011-01-08 15:26:00 2588
原创 Makefile.am使用
<br />具体步骤见“Autoconf与Automake”。<br />主要介绍Makefile.am的书写 :<br /> <br /><br /> AUTOMAKE_OPTIONS:设置 automake 的选项。Automake 主要是帮助开发 GNU 软件的人员来维护软件,所以在执行 automake 时,会检查目录下是否存在标准 GNU 软件中应具备的文件,例如 NEWS、AUTHOR、ChangeLog 等文件。设置 foreign 时,automake 会改用一般软件的标
2011-01-08 12:13:00 3379
原创 智能播放器
其实就是一个对所有mp3进行乱序,每次打开时保证不是同样的顺序,一个脚本,调用了smplayer。其中用到了之前的“将文本文件中的行随机排序”上脚本:#! /bin/shchmod +x randomsortcd /media/Software/Entertainment/Music/mp3/rm -rf list.m3ufind . -iname "*.mp3" >> list.m3u~/qibaoyuan/shell/randomsort list.m3u >> list.tmp
2011-01-08 02:46:00 737
原创 忙碌基本结束
<br />忙了好几天了,把shell编程、网络编程、多线程、多进程、Linux下的C语言、vim、Python,拼在一块,终于做成了一个基本的智能工厂。<br />主要的功能以及流程:下载网页、网页过滤(两个步骤可以合并),自己写了个分布式的分词架构,见之前的描述,主要是中心服务器、分词服务器和客户端之间通信、传递数据,用脚本合并分词文件,交给python处理生成CRF合格的测试语聊,用训练的model,验证,刚才看了了一下,正确率为:98.34%(total: 1242028 ,success: 122
2011-01-08 02:42:00 912
原创 python中合并文件
<br />#!/usr/bin/pythonimport os,sysread_size=1024def is_end_with(str1,str2): if len(str1)<len(str2): return 0 if str1[-len(str2):]==str2: return 1 return 0def merge(from_dir,to_file): output=open(to_file,'wb')
2011-01-08 02:33:00 1086
原创 python中小数除法
<br />from __future__ import divisionprint 'total:',total,',success:',success,',accur:%.4f'%(2/57) <br />例子:<br />#! /usr/bin/pythonfrom __future__ import divisionif __name__=='__main__': f=open('crf.result.txt','r') total=0 success=0
2011-01-08 02:32:00 1690
原创 vimrc文件
"文件类型检测filetype onfiletype plugin onfiletype indent on"一个tabset ts=4set expandtab"显示行号set nu"自动缩进set autoindent shiftwidth=4set cindent"语法高亮syntax enablecolorscheme vividchalk"taglist的设置let Tlist_Show_One_File=1 "只显示
2011-01-08 02:28:00 676
原创 信号量与多线程的退出
<br />两者都可以使用while进行等待,当条件比如处理队列或者资源队列为空时,可以直接发送post信号量和unlock thread,break出去。<br />voiddo_purify(){ debug_log("我是pufify线程0x%x/n",pthread_self()); while(1){ debug_log("thread 0x%x in do_purify/n",pthread_self()); sem_wait(&waitNonFull); p
2011-01-08 00:15:00 1079
原创 linux 下的文件操作
<br />保存一下;<br />/* * ===================================================================================== * * Filename: file_op.c * * Description: 基本的文件操作 * * Version: 1.0 * Created: 2011年01月06日 16时12分33秒 *
2011-01-07 19:24:00 612
原创 struct stat 的用法
<br />#include <sys/types.h>#include <sys/stat.h> int stat(const char *filename, struct stat *buf); //! prototype,原型 struct stat{ dev_t st_dev; /* ID of device containing file -文件所在设备的ID*/ ino_t st_ino; /* inode nu
2011-01-07 19:22:00 782
原创 Too many open files
socket编程中遇到的这个问题,刚开始还以为是socket fd没有关闭,检查了好多遍,都有close啊。郁闷死了。后来使用linux下的lsof命令找到问题的根源:1.首先得到id: ps -ef | grep "process"2.查看文件打开情况:lsof -p $pid3.在lsof中发现最后一列Name中打开了特别多的文件,忽然想起来,应该是打开的文件没有进行fclose。4.修改,添加fclose(fp);
2011-01-07 11:06:00 759
转载 linux多线程中的共享变量
<br />http://www.yuanma.org/data/2007/1108/article_2883.htm<br />当解决多线程互斥同步的问题时,经常会有如下几个问题:<br /><br />1. 在一个给定的问题中,需要多少个Mutex,多少个Semaphore?有什么规律?<br />2. 在对临界区加锁和等待信号量的顺序上有什么要求和规律?<br />3. 什么样操作适合放在临界区,什么样的不适合?<br /><br />下面就生产者和消费者问题来分析一些这几个问题.<br />下面是一
2011-01-06 17:36:00 5710
原创 集中分词服务器-原型
<br />1.基本思路:建立两个监听,一个接收用户的查询,一个接收配置服务器的自动注册。采用线程+网络编程,c语言 under ubuntu<br />/* * ===================================================================================== * * Filename: core_server.c * * Description: 中心服务器,负责进行分词服务器的分发以及信息收
2011-01-05 22:18:00 829
原创 多进程与多线程共享变量的处理
1.多进程中全局共享变量的处理是如此之麻烦,因为fork出来的子进程,是不在与父进程共享变量的,因此在主进程中进行的所有的对变量的修改都不会更新到子进程中,因此有很多的方法可以解决,今天试了试共享变量的方法,进本思路就是在内存中开辟一块内存,用指针指向那个变量,然后父子进程操作这个指针。如果要是在子函数中操作该变量,就得传递指针了,很麻烦。参见一个小伙子的代码:#include #include #include #include #include #define MAX_SEQUENC
2011-01-05 22:15:00 5390
原创 HtmlParser1.6修改输出Txt
<br />在NodeList中添加成员函数:<br />public StringBuffer getTxt() { StringBuffer ret; NodeList chirdren; Node node; TextNode txtNode; ret = new StringBuffer(); for (int i = 0; i < size; i++) { node = nodeData[i]; // 只提取txt部分 if (node
2011-01-05 15:52:00 848
原创 写StringBuffer到文件
<br />/* * 将结果写入文件 */ private static void createFile(File file, StringBuffer buffer) { try { File newFile = new File(file.getAbsolutePath() + ".txt"); if (newFile.exists())// 存在,则删除 if (!newFile.delete())// 删除成功则创建 { Syst
2011-01-05 15:50:00 7637
原创 movb,movsbl,movsbl的区别
<br /> <br />Both the movsbl and the movzbl instruction serve to copy a byte and to set the remaining bits in the<br />destination. The movsbl instruction takes a single-byte source operand, performs a sign extension to 32<br />bits (i.e., it sets the high
2011-01-05 10:42:00 9585 2
原创 将文本文件中的行随机排序【原创】
<br />目的:将生成的mp3列表随机打乱播放~~<br />使用:./randomsort list.m3u 4 >> list1.m3u<br />/* * ===================================================================================== * * Filename: randomsort.c * * Description: * * Version
2011-01-05 01:40:00 4104
原创 find查找忽略大小写
目的:生成mp3的播放列表1.find主要用来进行文件名的查找:find . -iname "*.mp3" >> list.m3u 2.grep主要是用来对文件内容查找。用到了再补充:)
2011-01-04 20:57:00 4137
原创 gdb显示结构体
<br />在gdb设置:set print pretty on <br />===========================其他<br />七、设置显示选项<br /> GDB中关于显示的选项比较多,这里我只例举大多数常用的选项。<br /> set print address<br /> set print address on<br /> 打开地址输出,当程序显示函数信息时,GDB会显出函数的参数地址。系统默认为打开的,如:<br /> (gdb)
2011-01-04 19:48:00 20520
原创 清空log的脚本
#!/bin/bash#cleanup from abs#3LOG_DIR=/var/logROOT_UID=0 #the one whose uid=0 has the root priv.LINES=50 #default linesE_XCD=66 #exit code if cannot access the folderE_NOTROOR=67 #exit code if not the root user#check if user is rootif [ "$
2011-01-04 00:33:00 1067
p6spy改造去掉resultset和添加每日归档
2013-07-31
僵尸网络研究
2008-05-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人