- 博客(8)
- 收藏
- 关注
转载 最短摘要生成与多模式匹配(一)
原文地址:http://yishan.cc/blogs/gpww/archive/2009/12/31/1338.aspx这是一个系列 非常好!!最短摘要生成与多模式匹配(一) 问题《编程之美》有一道题目“最短摘要生成”:若输入“微软 亚洲研院 使命”三个关键字,查找最短的摘要:微软研究院的使命是使未来的 计算机 能够看、听、学,能用 自然语言 与 人类 进行交流。
2010-05-28 12:57:00 870
转载 Google‘s Metrix - Ranking Factors (rank相关的因素)
Google的Ranking Factor有100多个,其中有很多对Recommendation Engine设计中也很有帮助。Overall Ranking Algorithm 24% Trust/Authority of the Host Domain22% Link Popularity of the Specific Page20%
2010-05-28 11:37:00 5141
转载 搜索的难题之Invisible Web/Deep Web
转贴来自:http://www.thinktag.cn/Deep Web (invisible Web) 中文可以翻译成深层网页或暗网。迈克尔.伯格曼将当今互联网上的搜索服务比喻为像在地球的海洋表面的拉起一个大网的搜索,巨量的表面信息固然可以通过这种方式被查找得到,可是还有相当大量的信息由于隐藏在深处而被搜索引擎所错失掉。数据来源:“Accessin
2010-05-28 11:31:00 1487
原创 统计文件中某个词的个数
1.统计出现过的行grep -c xxx abc.txt #区分不清同一行出现多次的情况grep -o xxx abc.txt | wc -l #这个是ok的awk -v RS=xxx END {print (--NR)} abc.txt
2010-05-27 16:00:00 537
转载 gimp使用内容感知填充处理图片
gimp使用内容感知填充处理图片原文地址:https://www.deleak.com/blog/2010/05/14/gimp-content-aware/很早以前,在小众软件上看到过一个神奇的去水印软件:Inpaint,试用后发现它真的可以轻松的去除掉图片的水印。现在想来,应该就是内容感知技术的一个具体应用吧。说起来呢,几乎所有的类似软件,都是基于以色列两位
2010-05-25 14:24:00 5686
原创 centos/redhat/fedora 系统管理员常用命令备忘
centos/redhat/fedora 系统管理员常用命令备忘系统: 查看内核/操作系统/CPU信息 | uname -a 查看操作系统版本 | head -n 1 /etc/issue 查看CPU信息
2010-05-24 13:29:00 941
原创 sed –in-place:原地替换
sed的原地替换tips:linux下 centos、redhat、fedora 系列下面原地替换file里面的所有的空格为空值sed -i ’s/ //g’ filefreebsd,Darwin(mac osx)系列下面:原地替换当前目录下所有文件里面的’/N’为空sed -i ” ’s////N//g’ *
2010-05-21 10:46:00 4762
原创 ping 广播地址实现 ip范围
要想直到一个网段内的主机有哪些,可以使用的办法是ping这个网段的广播地址(受限制广播、网段广播、子网广播、所有子网广播)。 比如:ping 172.16.23.255回复:PING 172.16.23.255 (172.16.23.255): 56 data bytes64 bytes from 172.16.23.85: icmp_seq=0 ttl=64 time=0
2010-05-17 10:25:00 5097
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人