- 博客(21)
- 资源 (2)
- 收藏
- 关注
原创 python 多线程采集网页
import threading,time,random,htmllib,urllib,formatter,string,redef getPageNum(data): result=re.findall( r'pageNum">共(\d+)' , data ) return result[0]def geturls(data,cururl): lin
2013-03-30 15:36:25 1304
原创 python多线程采集原理测试
import threading,time,randomclass weburl(): def __init__(self): self.l=[] self.count=0 self.cururl=5 self.per=100 def getUrl(self): i
2013-03-30 13:03:01 786
转载 Python多线程学习
一、Python中的线程使用: Python中使用线程有两种方式:函数或者用类来包装线程对象。1、 函数式:调用thread模块中的start_new_thread()函数来产生新线程。如下例: view plaincopy to clipboardprint?import time import thread def timer(no, inter
2013-03-29 17:09:48 519
转载 python htmllib.HTMLParser处理A标签获取链接和描述
HTMLParser类中有针对HTML标签的相应的函数,通过自定义,重载类中的函数来处理一些标签,函数如下:HTMLParser.anchor_bgn(href, name, type):#a标签开始的时候被调用,参数是A标签的属性值HTMLParser.anchor_end() #锚点标签结束的时候处理HTMLParser.save_bgn():#开始在缓冲区中保存字符数
2013-03-29 10:38:56 1149
原创 采集某个网站下的列表url及url的size
/** 目的:采集某个网站下的列表url及url的size 使用说明,下载canphp2.0目录lib的http.class.php类,下载simple_html_dom.php error.txt保存超时的url list.txt保存列表url及url的size error.txt保存记录所有不重复的url */include (
2013-03-28 11:45:19 1922
原创 Github for Windows使用图文教程
Git已经变得非常流行,连Codeplex现在也已经主推Git。Github上更是充斥着各种高质量的开源项目,比如ruby on rails,cocos2d等等。对于习惯Windows图形界面的程序员来讲,Github的使用是需要点时间和耐心的,然而最近Github发布了Github for Windows 则大大降低了学习成本和使用难度,他甚至比SVN都简单,好吧,你不信,我们来一步一步过一
2013-03-27 12:54:48 582
原创 如何拿53kf的会员信息
1。首先用firefox浏览器登陆53kf会员,打开会员列表的页面2.在firefox脚本监控器里添加如下代码 var i_i=1; var len_len=124; var arr_arr=new Array(); function running(){ to_page(i_i);
2013-03-22 23:37:53 772
原创 Linux Crontab 定时任务 命令详解
一. Crontab介绍 crontab命令的功能是在一定的时间间隔调度一些命令的执行。 1.1 /etc/crontab 文件 在/etc目录下有一个crontab文件,这里存放有系统运行的一些调度程序。每个用户可以建立自己的调度crontab。 如:[root@dave ~]# cat /etc/crontabSH
2013-03-22 17:01:32 477
原创 Nginx 日志文件切割
/usr/local/nginx/logs/下添加cut-log.sh文件LOGS_PATH=/home/wwwlogsYESTERDAY=$(date -d "yesterday" +%Y-%m-%d)mv ${LOGS_PATH}/1889.com.log ${LOGS_PATH}/1889.com_${YESTERDAY}.logkill -USR1 $(cat /u
2013-03-22 17:00:29 614
原创 Nginx自定义404错误页面,返回200状态码,非404状态码解决!
开始配置如下,结果发现返回状态码是200,搜索了一下解决方法,做个记录http{......fastcgi_intercept_errors on;......}#----------------------------------------server{#只是转跳而已error_page 404 = /404.html;}正确的设置方法应该是这样
2013-03-22 11:06:56 3817
原创 样式浮动居中颜色问题
如果内层浮动,那么最外层必须是浮动的,否则出现问题ul{ text-decoration:none; padding:0 auto;}ul li{ text-decoration:none; float:left; margin-right:20px; padding:0 auto;}body{ text-align:center;}.head{ text-align:cent
2013-03-20 11:54:32 637
原创 php去掉文本的前2个字段
$filename = "dbbak.txt";$contents = file_get_contents($filename);$pieces = explode("\n", $contents);$result_content="";foreach($pieces as $v){ $result_content.=substr($v,2);}file_pu
2013-03-20 10:13:05 714
原创 php数据库备份
// 备份数据库 $host = "localhost"; $user = "root"; //数据库账号 $password = ""; //数据库密码 $dbname = "qian"; //数据库名称 // 这里的账号、密码、名称都是从页面传过来的 if (!mysql_connect($host, $user, $password
2013-03-20 10:11:24 693
原创 Java中URL的使用
/****/package com.duoguo.url;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.MalformedURLException;import java.net.URL;impor
2013-03-14 23:01:09 601
原创 Wrong permissions on configuration file, should not be world writable问题解决办法
今天在linux服务器上安装配置完vsftpd之后,ftp根目录指定到网站根目录/var/www/,权限给以777,之后再次访问http://SERVER_IP_ADDRESS/phpMyAdmin,无法打开phpMyAdmin出现这样的提示:Wrong permissions on configuration file, should not be world writable!查资料一
2013-03-14 17:22:01 868
原创 常用网址
慧聪中国供应商以下的可以用火车头采集信息铭万网中国制造网多多返利淘宝客程序 http://down.admin5.com/php/69340.html
2013-03-14 12:44:44 452
原创 linux Apache 301转向实现方法介绍
文件是:/usr/local/nginx/conf/vhost/域名.conf以下是1889.com跳转到www.1889.comserver { listen 80; server_name 1889.com; rewrite ^/(.*)$ http://www.188
2013-03-13 10:37:49 871
原创 NGINX下如何自定义404页面
什么是404页面如果碰巧网站出了问题,或者用户试图访问一个并不存在的页面时,此时服务器会返回代码为404的错误信息,此时对应页面就是404页面。404页面的默认内容和具体的服务器有关。如果后台用的是NGINX服务器,那么404页面的内容则为:404 Not Found为什么要自定义404页面在访问时遇到上面这样的404错误页面,我想99%(未经调查,估计数据)的用户会把
2013-03-13 10:36:26 11153 3
原创 js中自动清除浏览器缓存方法
假如aa.jpg的图片在变化,可以添加?id="+Math.random()代码清除浏览器缓存,代码如下document.getElementById("pic_domain").src="aa.jpg"+"?id="+Math.random();
2013-03-08 15:06:58 9896
原创 Linux下更改目录及其下的子目录和文件的访问权限
[root@localhost ~]# chmod 777 /home/user 注:仅把/home/user目录的权限设置为rwxrwxrwx[root@localhost ~]# chmod -R 777 /home/user 注:表示将整个/home/user目录与其中的文件和子目录的权限都设置为rwxrwxrwx
2013-03-04 12:32:50 420
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人