- 博客(271)
- 收藏
- 关注
转载 基于视觉信息的网页分块算法(VIPS)
VIPS: a Vision-based Page Segmentation Algorithm.pdf下载 这篇论文的主要思想: 从人类的角度来看,当一个用户观察web页面的时候,它总是会自然而然的把一个语义块作为一个单一对象来看待,而不会管web页面的内部结构是如何描述的。因此一些视觉因素,比如背景颜色、字体颜色和大小、边框、逻辑块和逻辑块之
2012-07-29 15:22:13
11482
原创 自己用来做网盘的google code帐号被封了
今天偶然发现自己用来做网盘的google code帐号被封了,博客中大部分的下载链接应该都失效了,等哪天有空了再来整理整理吧。
2010-06-19 18:15:00
5776
1
转载 动态数组(一维驾驭高维数组)
<br />好的 coder 總是有辦法以 1D array 來駕馭高維陣列操作,<br />但有時使用高維陣列,可讓 code 中的邏輯概念更加清晰。<br />早期的 C 或目前的 C++ 中,無動態陣列配置的語法,<br />(在 C99 中才有,例如 gcc 可編譯動態陣列)<br />因此需要自己實現,底下是我的簡單作法:<br /><br />設計陣列配置時有 3 點需考量:<br /><br />1. 配置效率: 最好只呼叫一次 malloc 或 new。<br />2. 存取效率: 存取速度
2010-06-01 16:53:00
5229
3
原创 整理个人实现的Ftp服务器、Web Ftp服务器、Mini Http服务器
抽空在博客http://blog.csdn.net/yysdsyl/archive/2009/12/31/5115378.aspx中提到的框架基础上作了个最简单的Http服务器,只针对纯静态网页。然后又把之前写过的一个ftp服务器修补了下,最后做了个控制面板程序,统一管理Ftp服务器、Web Ftp以及Mini Web服务器。整个过程没任何技术含量,纯粹琐碎的整理工作,因此不对实现作介绍。
2010-04-13 22:05:00
7354
原创 基于mirrorrr搭建的自己的在线代理(http://zfqproxy.appspot.com/)
网址如下: http://zfqproxy.appspot.com/ PS:mirror项目的地址:http://code.google.com/p/mirrorrr/,有兴趣的也可以架设个自己的代理
2010-04-06 20:06:00
6396
1
原创 Coding Tools Online(在线编程小工具),第一个Google Application Engine作品
在Google Application Engine没封之前,先体验一把,做的东西很简单,就是提供MD5加解密、Base64编解码、汉字Unicode互转、汉字URL编码、汉字拼音查询、颜色查询、进制转换、ASCII码查询等这些编程中可能经常会用到的小工具,欢迎提供建议。网址:http://coding-tools.appspot.com/ 效果图:
2010-04-05 22:19:00
4521
原创 面试题精选(87):两数组包含问题(来自微软面试题)
题目:You have given two arrays, sayA: 4, 1, 6, 2, 8, 9, 5, 3, 2, 9, 8, 4, 6B: 6, 1, 2, 9, 8where B contains elements which are in A in consecutive locations but may be in any order.Find their star
2010-03-26 22:01:00
5773
4
原创 面试题精选(86):O(lgn)时间内找出有序数组中某个元素出现的次数
题目: 找出有序数组中指定元素出现的次数,要求时间复杂度为O(lgn) ex, 数组{0,0,0,2,3,3,3,3,3,4,5,5},0出现3次,3出现5次 思路: 很容易想到的一个办法是binary_search找到指定元素,然后左右查询,得到出现的次数k,但其时间复杂度为O(lgn)+k。 可通过改进binary_
2010-03-26 14:12:00
6870
3
原创 面试题精选(85):给定数组Arr[n],O(n)时间内找出每个元素左侧所有元素中位置最靠近该元素且大于该元素的元素
题目: 给定数组Arr[n],对于其中的每个元素Arr[i](0=Arr[i],并且i-k值最小(即最靠近)。 要求O(n)时间内找出Arr中所有元素对应的Arr[k]的位置。 ex, src[]: 9, 5, 2, 4, 7 dst[]: -1,0, 1, 1, 0 思路: 借助于栈来实现,从后向前遍历数组,whil
2010-03-26 12:42:00
5830
2
原创 百度贴吧验证码识别研究小记
在“验证码破解实战一例”中提到曾捣鼓过百度贴吧的验证码,不过分割始终做不好,最近整理了下,记在这里吧。 效果演示程序下载:TiebaCode.rar 效果截图: 由于分割工作做的不好,演示程序识别过程中有时会多次刷新验证码以达到较好的分割效果。 另外,之前捣鼓这的时候也顺便折腾了下使用python模拟百度贴
2010-03-24 18:32:00
10227
6
原创 手机同步软件(PhoneSync2.0)--新增短信接收功能
前一篇文章“PyQt开发的手机同步软件(方便的电话本编辑和短信群发功能)”发布了自己写的款手机同步软件,前两天有朋友对该软件提出了一些建议,于是就针对性的改了改,主要是添加了短信接收功能,这样的话来新的短信后不用翻看手机而直接通过软件阅读,很适合聊天。 效果图如下: 另外,有朋友还提到添加的发送号码在短信发送成功之后就清空了,这样每次都得重
2010-03-16 20:25:00
6973
10
原创 PyQt开发的手机同步软件(方便的电话本编辑和短信群发功能)
自己平时摆弄自己的破山寨iphone时,很多地方令人不爽,于是乎想到写一款支持电话本编辑和短信群发的软件。 还是先上效果图: 至于软件的实现没啥技术含量,在此不作说明。 软件简单介绍:1、由于软件的功能都是通过标准的GSM模块AT指令集来完成的,所以要想软件能工作,需要手机有
2010-03-11 18:39:00
6124
2
转载 【ZZ】Discuz论坛验证码破解
原文地址:http://www.seoo.org/2008/06/09/discuznet的gif动画验证码破解成功.htmlhttp://www.seoo.org/2008/07/06/复杂背景的验证码破解.html Gif动画验证码破解1、分析Gif动画,得到总帧数,和每帧的相关信息2、取出延迟时间最长的那一帧3、用第一行的每个像素颜色来去除背景
2010-03-05 15:05:00
9030
4
原创 连通区域标记:c++版的bwlabel实现(基于opencv)
类似于matlab中的bwlabel标记连通区域的c++版本实现,基于opencv,如下: ////////////bwlabel.cpp#include "cv.h"#include "highgui.h"#define NO_OBJECT 0#define MIN(x, y) (((x) < (y)) ? (x) : (y))
2010-03-03 17:53:00
21032
8
原创 验证码破解实战一例
年前有一段时间看了篇“如何识别高级的验证码”的文章,里面所提到的很多东西都是我平时所接触所用到的,于是乎就拿百度贴吧的验证码来练了练手。百度贴吧的验证码如下图所示捣鼓了一两天的时间,对于手动分割好的单个字符的识别准确率倒是不低,不过始终没能很好的解决粘连字符的分割问题,后来就放下了。 这两天一同学让帮忙破解一网站的验证码,瞅了下是比较传统的数字验证码,而且无
2010-02-26 15:36:00
11483
转载 【转帖】分享有趣的面试智力题
原文地址:http://www.matrix67.com/blog/archives/501 http://www.matrix67.com/blog/archives/502 偶然进了这个页面,看到几个原来没见过的面试智力题。顺带也翻译一些比较少见、可能有人没见过的题目写在这里。有几个题目在国内流传相当广,什么n个人怎么分
2010-01-25 21:49:00
4726
1
转载 【转帖】文件缓存相关
文件缓存系统的设计与实现2008-09-23 15:22 作者:刘晨光 QQ:64452627 MSN:liuchenguang_pro@hotmail.com 转载请注明出处 2008-09-23 一、项目背景 随着系统运营时间的增加,数据量与日俱增,数据库系统单张表的数量超过百
2010-01-19 16:57:00
3942
转载 [转帖]输入一个新的网址后到完全显示页面,浏览器做了哪些工作?
原文地址:http://topic.csdn.net/u/20100105/11/382a3b43-e0a7-4adf-aa91-bf6ff7e25539.html 前段时间接到XX公司的电话面试,问到了类似于这样几个题目, 从输入一个新的网址到用户完全看到页面,这期间浏览器做了哪些工作? 输入网址后浏览器是先读取缓存文件夹还是先连接服务器? ..... 其实我个人觉得他问这个题重点
2010-01-07 21:59:00
4550
转载 [zz]在 linux 下使用 CMake 构建应用程序
原文地址:http://www.ibm.com/developerworks/cn/linux/l-cn-cmake/index.html 本文介绍了一个跨平台的自动化构建系统 CMake 在 linux 上的使用方法。 CMake 是一个比 automake 更加容易使用的工具,能够使程序员从复杂的编译连接过程中解脱出来。文中通过一些例子介绍使用 CMake 处理多源文件目录的
2010-01-07 13:55:00
5894
原创 "c++实现的Mini Web Server,暂时当ftp使用" ---续 (Linux版)
本文接 c++实现的Mini Web Server,暂时当ftp使用> 给出Mini WebServer for Ftp的linux版本。 效果图: Linux版miniweb下载:miniweb_linux.tar.gz 关键代码: 和Windows版的主要区别在于IoUtil.cpp文件中关于文件目录信息的
2010-01-06 22:05:00
5467
2
原创 c++实现的Mini Web Server,暂时当ftp使用
废话不多说,先上效果图:启动web server: 浏览器截图: 下载使用(暂时只有Windows版,Linux版有时间的话补上):miniweb.rar 下面直接贴出主要实现代码:Http类主要负责接收、解析客户端请求,然后通过WebAction类响应并发送相应的数据Http.h#ifndef _HTTP_H#de
2009-12-31 22:06:00
5791
3
转载 [zz]c++有时比Python慢
原文地址:http://student.csdn.net/space.php?uid=112600&do=blog&id=14316 部门最近在搞JVM上的动态语言,比如Groovy。在享受了动态语言的种种灵活之后,性能自然而然被拿出来PK。然后玩Python的同事就旧事重提,从网上找来一段Python代码,很多Python的人都知道了,很多C++的人也知道了,它跑得很
2009-12-10 14:53:00
1505
转载 在GUI程序中使用控制台的两种方法
原文地址:http://student.csdn.net/space.php?uid=112600&do=blog&id=10713http://student.csdn.net/space.php?uid=112600&do=blog&id=12217 当我们第一次接触C++时,写的第一行代码,可能就是:Code://... std
2009-12-10 10:47:00
7857
1
转载 数据类型和Json格式
1.前几天,我才知道有一种简化的数据交换格式,叫做yaml。我翻了一遍它的文档,看懂的地方不多,但是有一句话令我茅塞顿开。它说,从结构上看,所有的数据最终都可以分成三种类型:第一种类型是scalar(标量),也就是一个单独的string(字符串)或数字(numbers),比如“北京”这个单独的词。第二种类型是sequence(序列),也就是若干个相关的数据
2009-11-26 12:46:00
830
2
原创 小记VMWare下给linux添加新硬盘(备忘)
之前在VMWare下装的linux系统的可用硬盘空间越来越少,已经严重影响正常的使用了,于是就给它在VMWare下加了块硬盘,步骤如下: 1、通过VMWare给linux系统添加一个新硬盘 2、重启linux系统,键入 fdisk –l 命令查看新增硬盘的盘符(通常会有 “doesnt contain a valid partion table”的提示信息),假设为 /dev/sdb 3、
2009-11-23 19:47:00
1223
原创 基于PyQt开发的第二个小程序:高校BBS发帖辅助软件(CampusBBSAssistant)
该小软件旨在辅助高校BBS用户方便发帖之用,实现的主要功能包括登陆登出BBS站点,上传附件以及发表帖子功能。由于测试账号有限,目前本软件只支持白云黄鹤、水木社区、水木清华、饮水思源、科苑星空5个高校BBS站点。(如果有愿意提供账号以供开发测试之用的,本人非常感谢,联系方式:yysdsyl#qq.com) 软件下载地址:CampusBBSAssistant 软件效果展示:
2009-11-18 13:31:00
2690
原创 [zz]无所不在的context switch
有时候电脑忽然慢下来,这时候打开「工作管理员」(Task Manager),你会惊讶地发现,怎么有这么多莫名其妙的「常驻程式」正同时在执行? 其中一个罪魁祸首程式占用了CPU将近百分之百的效能,难怪你的Visual Studio忽然变得这么慢。 不仅电脑中有许多常驻程式,会来中断我们的重要程式,我们现实的生活中,也有许多例行与非例行的事项,占据我们一天中大多数的时间,让我 们做事的效率不彰。可
2009-11-05 12:51:00
1368
原创 [zf from byhh]百度完整的面试经历
前言:百度是我一直很崇拜的地方,也一直非常期待的地方。可能是源于我对网上诸多面经的理解以及她在宣讲会前后的宣传,我一直以为百度是一个只有非常牛X的人才能去的地方,里边的人都是超级大牛,所以像我这种机械专业的菜鸟学生参加她的宣讲会也就是去参观参观,娱乐娱乐而已。至于到后面为什么一不小心拿到了百度的offer,可能一半是实力一半是运气吧。百度的宣讲会来得非常早,在九月十八号就来了,也是我参
2009-11-04 13:37:00
7783
4
原创 [zz from byhh]完整的阿里支付宝面试经过
前言:支付宝是我的一个意外收获,当初并不是很重视它,只是和其他人一起跟风投了它,后来才知道它是阿里旗下的一家公司,而且待遇和腾讯差不多,位于杭州。支付宝的招聘是所有IT企业中效率最高的一家,从宣讲到拿到offer,不到72小时。大概是10月二十多号晚上,支付宝前在大活305宣讲,我也兴冲冲地去了,拿了一个精美的笔记本和一张招聘宣传册,一看才知道我投的系统工程师的位子全国居然只
2009-11-04 13:35:00
7150
3
原创 [zz from byhh]完整的腾讯面试经过
前言:从9月10号开始到现在快两个月了,两个多月中,我经历数次面试和笔试,在经历这些的同时积累了不少的经验,也学到了不少东西,在此把它记录下来,算是和一起找工作中的同学一起共勉吧。我是本校的学生,专业是机械制造及其自动化,找工作的主要目标是计算机软件类和机械制造方向的国内的企业,所以意向去外企的同学就不必浪费时间看这些面经啦,想去国内IT企业的同学可以继续看下去。本贴中我把最
2009-11-04 13:02:00
10453
1
原创 网站模拟登陆备忘(php + python)
php版: <?php $cookie_file = fopen(cookie.txt,w);//dirname(__FILE__)."/cookie_".md5(basename(__FILE__)).".txt"; // 设置Cookie文件保存路径及文件名 function vlogin($url,$data){ // 模拟登录获取Cookie函数
2009-11-01 16:33:00
3001
转载 [转帖]在Eric4下用PyQt4编写Python的图形界面程序
本文是PyQt4的入门教程。网上能搜到其它教程,但我觉得讲得不是很清楚,希望这篇文章对入门者更加有帮助。 先介绍一下PyQt4。Qt4图形库一经发布就好评不断,它在Python下的绑定PyQt4更是让我眼前一亮,不但漂亮,而且开发程序非常方便。在我看来,PyQt4最大的改进之一是它不再拘泥与各种布局控件了,也就是说,现在写图形界面程序,和VB一样可以直接拖控件到窗口上并随便改变大
2009-10-19 13:36:00
1875
转载 最长运行时间(百度09笔试题)
条件:1K内存,1MHzCPU,每秒可以改变2^20次状态。问:一个程序最长的运行时间是多少? 答: 首先程序是确定性的,就说明内存的状态不会重复,否则就永远结束不了。从这一点出发,可以知道内存的状态共有 2^8k , 然后CPU每秒改变 2^20 个状态,所以这台计算机最长出现不重复的状态 2^(8k-20)秒。
2009-10-18 15:59:00
1434
1
原创 驾照考试题库查询系统(wap版兼普通web版实现,使用php+wml)
“驾照考试题库查询系统”干的事情很简单:输入题目关键字,查询答案。这个东西早在我考驾照时就想做了,不过当时没能力也没时间整,现在项目闲暇时整整玩挺不错。(下面给个web版的效果截图) 感兴趣的也可以访问http://zfqnet.cn看一看效果,当然也可以用你的手机试试看能不能正常打开。 我的山寨iphone自带的wap浏览器可以很正常的工作,不过自己后
2009-10-17 20:24:00
8405
原创 php字符集转码 (兼转载一篇讲解字符编码的文章)
最近遇到utf-8和gb2312间转码的问题,最终通过函数iconv解决 $str_gb = iconv("UTF-8", "gb2312", $str);......$str_utf8 = iconv("gb2312", "UTF-8", $str_gb_result); 当我们不知道传进来的字符集是utf-8或者gb2312时,就得手工判断并采取相应操作了 fun
2009-10-08 21:58:00
3421
原创 memory pool(内存池)的模板实现(暂不支持多线程)
MemoryPool代码: #include #include template class MemoryPool{public: MemoryPool(void) { }; virtual ~MemoryPool(void) { }; static VOID* operator new(size_t
2009-10-07 05:57:00
1457
2
原创 浏览器(或客户端)触发,后台运行php脚本
今天在0fees.net上申请了个免费的php空间,然后把前两天折腾的csdn博客文章抓取程序和csdn博客用户爬取程序放上去了,虽然空间是国外的,不过速度还算可以。 既然有了现成的空间可用,于是就打算把正在进行的爬取程序放服务器上运行,不过试的过程中遇到这样的问题,就是:我从浏览器这端触发服务器上的php脚本,要想让服务器端的php脚本一直执行,我得把该网页一直开着,这样就达不到我不开电
2009-10-06 18:16:00
5306
1
原创 php实现的简单的csdn博客文章抓取(续:添加用户名搜索提示)
上篇blog文章实现了根据指定的csdn用户名列出其所有的blog文章的功能,不过这个其实没多大实际用处,我们必须得精确知道感兴趣用户的用户名才能列出他的blog文章,所以闲来想弄一个类似于google suggest的输入提示功能。要实现搜索提示,当然手头得有csdn用户列表可供使用,毫无疑问这个用户列表要靠自己去crawl,于是写了个极其简单的爬取php脚本,如下: <?php
2009-10-04 16:38:00
1523
原创 php实现的简单的csdn博客文章抓取
纯粹php、regul expression练手之用,高手请绕道走效果图:怎一个丑字了得!代码://///list.phpfor list csdn blog entryCSDN BLOG ENTRY LIST
2009-09-30 15:10:00
1560
转载 .obj, .lib, .dll, .exe的关系
lib是和dll对应的。 lib是静态的库文件,dll是动态的库文件。 所谓静态就是link的时候把里面需要的东西抽取出来安排到你的exe文件中,以后运行 你的exe的时候不再需要lib。 所谓动态就是exe运行的时候依赖于dll里面提供的功能,没有这个dll,你的exe无法运 行。 lib, dll, exe都算是最终的目标文件
2009-09-25 12:32:00
6513
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人