自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

转载 Linux入门.2_shell位置参数

讲解一 1.概念   位置参数(position parameter)     运行脚本前(调用函数前),shell 传递给脚本的参数。      2. 原理 bash 脚本的位置参数的传递可以做如下理解:    1. shell将用户输入的命令行 分别赋值给 1, 2, 3, 4, 5....N    2. 然后将最后一个参数的名称 N 赋值给 #

2012-07-19 13:58:05 590

转载 Linux入门-1.vim格式设置

在终端下使用vim进行编辑时,默认情况下,编辑的界面上是没有显示行号、语法高亮度显示、智能缩进等功能的。为了更好的在vim下进行工作,需要手动设置一个配置文件:.vimrc。在启动vim时,当前用户根目录下的.vimrc文件会被自动读取,该文件可以包含一些设置甚至脚本,所以,一般情况下把.vimrc文件创建在当前用户的根目录下比较方便,即创建的命令为:$vi ~/.vimrc

2012-07-16 16:13:04 696

转载 Python进阶_8.Pyscripter编码错误

你python的安装目录下的Lib目录找到site.py,修改def setencoding()方法def setencoding():   .....   ....    if 0:        # Enable to support locale aware default string encodings.把那个if 0该位if 1试试。。 还有就是最好文件目录中不要出

2012-04-19 18:14:44 562

转载 Python进阶_7.Eclipse + PyDey

前言    笔者最近迷上了Python,但是一直没有找到满意的IDE。虽然使用Vim编辑器+命令行的方式比较酷,然而一个优秀的IDE确实能让开发速度提升不少。于是笔者想到Eclipse——一个神一样的利器。经过一番曲折,终究修成正果。整理成文,希望对热爱的Python的童鞋有所帮助。正文   首先我们需要明白一点——Eclipse作为一个灰常优秀的开发工具,它可被用作N多语言的IDE,

2012-03-20 22:57:48 779

转载 Lisp_1.Clisp笔记

下面的代码大部分来自网络,版权归原作者所有。规则:loop    read in an expression from the console;    evaluate the expression;    print the result of evaluation to the console;end loop.补充:一切都是函数,任何函数都在括号内

2012-03-20 22:42:24 521

转载 Java_ABC_10.HashMap的遍历

第一种:Map map = new HashMap();Iterator iter = map.entrySet().iterator();while (iter.hasNext()) {    Map.Entry entry = (Map.Entry) iter.next();    Object key = entry.getKey();    Object val =

2012-03-10 22:53:54 216

原创 Python进阶_6.爬虫中总结的Python

1. 设置字符编码格式    #设定编码格式        encoding = sys.getfilesystemencoding()    #编码格式转换        html_str = html_str.decode('UTF-8').encode(encoding)2. 查看变量类型        print type(html_str)3.

2012-02-20 21:13:06 427

原创 Python进阶_5.正则表达式,贪婪 非贪婪

字符:>abc234表达式:>(.*)   =   abc234 表达式:>(.*?)   =  abc

2012-02-19 21:08:32 469

转载 Python进阶_4.Windows下Python程序独立运行

一、简介py2exe是一个将python脚本转换成windows上的可独立执行的可执行程序(*.exe)的工具,这样,你就可以不用装python而在windows系统上运行这个可执行程序。py2exe已经被用于创建wxPython,Tkinter,Pmw,PyGTK,pygame,win32com client和server,和其它的独立程序。py2exe是发布在开源许可证下的。

2012-02-17 22:21:35 2549

原创 Java_ABC_9.遍历文件夹

package comment;import java.io.*; import java.util.ArrayList;public class EraseComments { /** * @param args */ public static ArrayList m_listPath = new ArrayList(); public s

2011-12-19 14:53:38 393

原创 每天学点C++_2.循环读取文件夹中的文件

//读取文件,将处理结果输出void ReadFiles(CString strAP, string _outPath) { ifstream read; read.open(strAP); ofstream write; write.open(_outPath.c_str(), ios::out | ios::app); if (write.fail() | read.fail(

2011-12-19 14:35:07 2104 1

原创 MFC一点通—1.ListCtrl空间

1.ListCtrl效果2.操作步骤(1)在VS2008中新建对话框IDD_WORD,在对话框上添加ListCtrl控件IDC_LIST_WORD(2)为对话框IDD_WORD建立关联类WordResult类在头文件中加入 //添加ListCtrl类变量 自定义变量 CListCtrl m_listCtrl; map m_wordMap; //重载初始化方法

2011-12-15 19:25:32 922

原创 每天学点C++_2.Int转String

//整型数值int count = 5;//字符数组型数值char ch_count[5];//字符串型string str_count;//将整型数值转换为字符数组数值sprintf(ch_count, "%d", count);//将字符数组存于字符串str_count=ch_count;

2011-12-04 21:11:30 254

原创 Python进阶_3.正则表达式(2)

1.北美电话号码格式:J. Doe: 248-555-1235           B. Sae: (313) 555-1234           A. Dee: (612)555-1235匹配:'\\(?[2-9]\\d\\d\\)?[ -]?[2-9]\\d\\d-\\d{4}' 2.美国邮政编码格式:45854           12458-4521匹

2011-11-30 12:47:16 895

原创 Git_1.Clone

ssh://baidu.com/git/spider.git 进入目的文件夹目录,如E:E:git clone ssh://username@baidu.com/git/spider.git

2011-11-28 17:58:37 276

原创 Python进阶_3.正则表达式(1)

#引入re包import re Python正则表达式有两种编译方式:1)re.compile(pattern[, flags]),把正则表达式的模式和标识转化成正则表达式对象      compiled_pattern=re.compile(pattern)       result = compiled_pattern.match(string) 2)resul

2011-11-23 21:05:39 754

原创 Python进阶_2.通过URL获取HTMl内容

import urllib,urllib2#1.建立URL请求url = 'http://www.baidu.com'req = urllib2.Request(url)#2.为URL请求添加信息req.add_header('User-Agent', "Mozilla")req.add_header('SpiderClient', ’spider‘)#3.打开URL请求

2011-11-22 01:16:15 901

原创 Python进阶_1.读写文件

#写文件str1 = 'test'#1、新建文件流write = open('123.txt','w')#write = file('123.txt','w')#2、写文件write.write(str1)#3、关闭文件流write.close() #读文件#1、新建文件流read = open('123.txt','r')#read = fil

2011-11-22 00:50:15 374

原创 Java_ABC_9.Java中导入dll文件

1. C++生成DLL文件     1.1创建工程            打开VC++编译器,然后选择Win32 Project ,然后选择工程位置和工程名称,然后点击下一步,再点击下一步 ,在应用程序类型 中选择DLL(D),然后点击完成 ,至此工程创建成功。     1.2编写函数       工程名字是test,在源文件文件夹中会有一个”test.app“文件,打开文件,

2011-11-15 15:14:59 525

原创 玩转Solr.1——solr的起步

1. 选择镜像站点,下载最新版Solr。笔者用的版本是3.3.0,因此以3.3.0为例2. 将下载的apache-solr-3.3.0.rar解压到D盘,如D:/apache-solr-3.3.0,       进如solr主目录,选择example文件夹,运行start

2011-10-18 22:50:03 283

转载 利用 Heritrix 构建特定站点爬虫

本文由浅入深,详细介绍了 Heritrix 在 Eclipse 中的配置、运行。最后对其进行扩展,介绍如何实现只抓取特定网站的页面。通过本文,读者可以了解 Heritrix 的相关特点以及在 Eclipse 中的配置运行,能够从零开始构建特定站点的专有爬虫,从而为网站增加全文

2011-10-18 22:36:13 889

原创 每天学点C++_1.iter

1 当vector为空时,可以用iter = vector.begin(),这样赋值iter为空。但是如果对iter进行*iter,则会报错!!!

2011-09-26 19:12:53 278

原创 Java_ABC_8.mmseg导入Solr

1. mmseg4j 用 Chih-Hao Tsai 的 MMSeg 算法(http://technology.chtsai.org/mmseg/ )实现的中文分词器,并实现 lucene 的 analyzer 和 solr 的TokenizerFactory 以方便在Lucen

2011-07-21 13:00:43 551

原创 Java_ABC_7.连接Solr,查询数据

package solrj;import java.io.IOException;import java.net.MalformedURLException;import java.util.ArrayList;import java.util.Collect

2011-07-21 12:22:01 706

原创 Java_ABC_6.解析XML

package xml;import org.w3c.dom.*;import javax.xml.parsers.*;public class XmlParser{ private Document document = null; /**

2011-07-21 12:19:17 275

原创 Java_ABC_5.写入XML

package xml;import java.io.FileOutputStream;import org.dom4j.Document;import org.dom4j.DocumentFactory;import org.dom4j.Element;

2011-07-21 12:11:52 255

原创 Java_ABC_4.Lucene搜索

package lucene;import java.io.File;import org.apache.lucene.document.Document;import org.apache.lucene.index.Term;import org.apach

2011-07-21 12:07:10 207

原创 Java_ABC_3.Lucene创建索引

package lucene;import java.io.File;import java.io.FileReader;import java.io.Reader;import java.util.Date;import org.apache.lucen

2011-07-21 12:05:53 242

原创 Java_ABC_2.读写文件

package file;import java.io.BufferedReader;import java.io.BufferedWriter;import java.io.FileReader;import java.io.FileWriter;imp

2011-07-21 12:03:08 308

原创 Java_ABC_1.连接MySQL数据库

package jdbc;import java.io.BufferedReader;import java.io.FileReader;import java.io.FileWriter;import java.io.IOException;import

2011-07-21 12:01:14 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除