备忘
iteye_14216
这个作者很懒,什么都没留下…
展开
-
本周任务备忘
本周任务备忘:1、网页内repeatable pattern的自动识别,block repeat script,block repeat的crawl.[repeatable pattern的detect算法通过对抽象出来的模型使用动态规划已经解决,复杂度O(m+n),已做了一些试验,效果很好]2、网页中pagination的自动识别,建立pagination模型,dectect Next Pag...2008-09-23 16:35:14 · 97 阅读 · 0 评论 -
几种语言的正则表达式修饰(modifers)【备忘】
PHP+Perli 完成不区分大小写的搜索g 查找所有出现(all occurrences,完成全局搜索)m 将一个字符串视为多行(m就表示多(multiple))。默认情况下,^和$字符匹配字符串中的最开始和最末尾。使用m修饰符将使^和$匹配字符串中每行的开始s 将一个字符串视为一行,忽略其中的所有换行符;它与m修饰符正好相反x 忽略正则...2009-12-07 23:27:41 · 131 阅读 · 0 评论 -
下半年学习计划
一、与linux相关的:bash,linux下c,linux系统编程。相关工具:vim熟练使用各种快捷键。现在开发都ssh到服务器,然后命令行开发,比较郁闷,中文乱码问题,工程无法一目了然的看到需要的文件,不停的敲cd, ls。其实我还是比较习惯使用eclipse。脚本语言:二、python,现在服务器和测试机只支持python,perl,大家都用python和perl,所以要...2009-06-17 23:42:43 · 99 阅读 · 0 评论 -
开始要把需求搞清楚
项目中有时需求没有搞的很清楚,就开始按照自己的想象去做,而我们想象的需求和实际的需求还是有一些差距的,这往往会导致不必要的返工。今天就犯了这个错误,本来要统计是从已经提供好的当天的随机和top的1W Query的数据源的东东,结果自己以为query_log就是要统计的数据源,然后还试图去如何随机选取query,而query_log是超过5000w级别的query数,top query的...2009-09-21 23:08:06 · 80 阅读 · 0 评论