自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(62)
  • 资源 (3)
  • 收藏
  • 关注

转载 java追加写文件

BufferedWriter bw = new BufferedWriter(new FileWriter(new File("e:\\testout\\","1111.txt"),true));bw.append(text,0,text.length());   //向文件追加写入text 其中,FileWriter(String filename,boolean append)方法中

2012-07-30 17:43:12 673

java追加写文件

BufferedWriter bw = new BufferedWriter(new FileWriter(new File("e:\\testout\\","1111.txt"),true));bw.append(text,0,text.length()); //向文件追加写入text其中,FileWriter(String filename,boolean append)方法中a...

2012-07-30 17:43:00 81

转载 List Tuple Dictionary 区别

Dictionary 是 Python 的内置数据类型之一, 它定义了键和值之间一对一的关系。每一个元素都是一个 key-value 对, 整个元素集合用大括号括起来您可以通过 key 来引用其值, 但是不能通过值获取 key在一个 dictionary 中不能有重复的 key。给一个存在的 key 赋值会覆盖原有的值。  在任何时候都可以加入新的 key-value 对。这种语法

2012-07-24 09:48:26 2022

List Tuple Dictionary 区别

Dictionary 是Python的内置数据类型之一, 它定义了键和值之间一对一的关系。每一个元素都是一个 key-value 对, 整个元素集合用大括号括起来您可以通过 key 来引用其值, 但是不能通过值获取 key在一个dictionary 中不能有重复的 key。给一个存在的 key 赋值会覆盖原有的值。在任何时候都可以加入新的 key-value 对。这种语法同修改存在...

2012-07-24 09:48:00 149

转载 python list

创建列表sample_list = ['a',1,('a','b')]Python 列表操作sample_list = ['a','b',0,1,3]得到列表中的某一个值value_start = sample_list[0]end_value = sample_list[-1]删除列表的第一个值del sample_list[0]在列表中插入一

2012-07-24 09:46:39 765

python list

创建列表 sample_list = ['a',1,('a','b')]Python 列表操作 sample_list = ['a','b',0,1,3]得到列表中的某一个值 value_start = sample_list[0] end_value = sample_list[-1]删除列表的第一个值 del sample_list[0]在列表中插入一个值 sample_li...

2012-07-24 09:46:00 70

转载 pydev eclipse插件安装

今天决定重新捡起以前落下的知识,开始对python的学习。熟话说,工欲善其事,必先利其器。搭建一个良好的IDE环境是为了以后更好的使用python语言。通过百度或者Google搜索的结果,最后我决定使用Eclipse + pydev作为我的python编程环境。操作系统版本:64位 windows 7 旗舰版Eclipse版本:Helios 3.6pydev版本:1.4.8.288

2012-07-23 16:02:55 5264 1

pydev eclipse插件安装

今天决定重新捡起以前落下的知识,开始对python的学习。熟话说,工欲善其事,必先利其器。搭建一个良好的IDE环境是为了以后更好的使用python语言。通过百度或者Google搜索的结果,最后我决定使用Eclipse + pydev作为我的python编程环境。操作系统版本:64位 windows 7 旗舰版Eclipse版本:Helios 3.6pydev版本:1.4.8.2881JDK版...

2012-07-23 16:02:00 65

转载 Eclipse 报 “Exception in thread "main" java.lang.OutOfMemoryError: Java heap space ”错误的解决办法

Eclipse 报 “Exception in thread "main" java.lang.OutOfMemoryError: Java heap space ”错误的解决办法1、打开Eclipse软件,选择菜单栏run,在二级菜单中选择 Debug Configurations...  项,如下图所示。  2、在弹出的窗口中选择 (x)=Arguments 选项卡,VM

2012-07-23 09:53:15 2300

Eclipse 报 “Exception in thread "main" java.lang.OutOfMemoryError: Java heap space ”错误的解决办法...

Eclipse 报 “Exception in thread "main" java.lang.OutOfMemoryError: Java heap space ”错误的解决办法1、打开Eclipse软件,选择菜单栏run,在二级菜单中选择 Debug Configurations... 项,如下图所示。 2、在弹出的窗口中选择 (x)=Arguments 选项卡,VM a...

2012-07-23 09:53:00 262

转载 阻塞于同步异步

探测消息的机制:同步(忙等)/异步(走人)处理消息的对策:阻塞(挂起等)/非阻塞(返回特殊值)我喜欢用自己的语言通过联系现实生活中的一些现象解释一些概念,当我能做到这一点时,说明我已经理解了这个概念.今天要解释的概念是:同步/异步与阻塞/非阻塞的区别.这两组概念常常让人迷惑,因为它们都是涉及到IO处理,同时又有着一些相类似的地方.首先来解释同步和异步的概念,这两个概念与消息

2012-07-20 16:37:43 682

阻塞于同步异步

探测消息的机制:同步(忙等)/异步(走人)处理消息的对策:阻塞(挂起等)/非阻塞(返回特殊值)我喜欢用自己的语言通过联系现实生活中的一些现象解释一些概念,当我能做到这一点时,说明我已经理解了这个概念.今天要解释的概念是:同步/异步与阻塞/非阻塞的区别. 这两组概念常常让人迷惑,因为它们都是涉及到IO处理,同时又有着一些相类似的地方. 首先来解释同步和异步的概念,这两个概念与消息的通知...

2012-07-20 16:37:00 47

转载 scapy安装and简介

在《开源python网络爬虫框架Scrapy介绍》一文中介绍了Scrapy这个Python爬虫框架。Scrapy是一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitem

2012-07-20 16:19:51 7340 2

scapy安装and简介

在《开源python网络爬虫框架Scrapy介绍》一文中介绍了Scrapy这个Python爬虫框架。Scrapy是一个快速,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试。Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、site...

2012-07-20 16:19:00 120

转载 scapy递归爬

前面介绍了Scrapy如何实现一个最简单的爬虫,但是这个Demo里只是对一个页面进行了抓取。在实际应用中,爬虫一个重要功能是”发现新页面”,然后递归的让爬取操作进行下去。发现新页面的方法很简单,我们首先定义一个爬虫的入口URL地址,比如《Scrapy入门教程》中的start_urls,爬虫首先将这个页面的内容抓取之后,解析其内容,将所有的链接地址提取出来。这个提取的过程是很简单的,通过一个

2012-07-20 16:17:50 1834

scapy递归爬

前面介绍了Scrapy如何实现一个最简单的爬虫,但是这个Demo里只是对一个页面进行了抓取。在实际应用中,爬虫一个重要功能是”发现新页面”,然后递归的让爬取操作进行下去。发现新页面的方法很简单,我们首先定义一个爬虫的入口URL地址,比如《Scrapy入门教程》中的start_urls,爬虫首先将这个页面的内容抓取之后,解析其内容,将所有的链接地址提取出来。这个提取的过程是很简单的,通过一...

2012-07-20 16:17:00 295

转载 Scrapy入门教程

本文参考Scrapy Tutorial里面的文档,翻译出来加上自己的理解,供大家学习。在本文中,我们将学会如何使用Scrapy建立一个爬虫程序,并爬取指定网站上的内容,这一切在Scrapy框架内实现将是很简单轻松的事情。本教程主要内容包括一下四步:1. 创建一个新的Scrapy Project2. 定义你需要从网页中提取的元素Item3. 实现一个Spider类,通

2012-07-20 16:15:35 5825 3

Scrapy入门教程

本文参考Scrapy Tutorial里面的文档,翻译出来加上自己的理解,供大家学习。在本文中,我们将学会如何使用Scrapy建立一个爬虫程序,并爬取指定网站上的内容,这一切在Scrapy框架内实现将是很简单轻松的事情。本教程主要内容包括一下四步:1.创建一个新的Scrapy Project2.定义你需要从网页中提取的元素Item3.实现一个Spider类,...

2012-07-20 16:15:00 116

转载 python 爬虫抓站

python 爬虫抓站 记录(虾米,百度,豆瓣,新浪微博)python 下用到的库,urllib, urllib2, BeautifulSoup, cookielib, mechanize, re看Firebug模拟浏览器行为。1. 虾米虾米不用登陆,没有IP限制,最简单。Python抓了下Xiami电台的试听数 里用的是import urllib2

2012-07-20 15:29:57 2797

python 爬虫抓站

python 爬虫抓站 记录(虾米,百度,豆瓣,新浪微博)python 下用到的库,urllib, urllib2, BeautifulSoup, cookielib, mechanize, re看Firebug模拟浏览器行为。1. 虾米虾米不用登陆,没有IP限制,最简单。Python抓了下Xiami电台的试听数里用的是import urllib2 con...

2012-07-20 15:29:00 216

转载 python spider code

Python代码  #FileName: toolbox_insight.py  from sgmllib import SGMLParser  import threading  import time  import urllib2  import StringIO  import gzip  import string  import os

2012-07-20 15:19:20 2263

python spider code

 Python代码#FileName:toolbox_insight.pyfromsgmllibimportSGMLParserimportthreadingimporttimeimporturllib2importStringIOimportgzipimportstringimportos#rewriteSGMLParse...

2012-07-20 15:19:00 140

转载 python crawler(2)

以前写过一篇使用python爬虫抓站的一些技巧总结,总结了诸多爬虫使用的方法;那篇东东现在看来还是挺有用的,但是当时很菜(现在也菜,但是比那时进步了不少),很多东西都不是很优,属于”只是能用”这么个层次。这篇进阶篇打算把“能用”提升到“用得省事省心”这个层次。一、gzip/deflate支持现在的网页普遍支持gzip压缩,这往往可以解决大量传输时间,以VeryCD的主页为例,未压缩

2012-07-20 15:08:25 1761

python crawler(2)

以前写过一篇使用python爬虫抓站的一些技巧总结,总结了诸多爬虫使用的方法;那篇东东现在看来还是挺有用的,但是当时很菜(现在也菜,但是比那时进步了不少),很多东西都不是很优,属于”只是能用”这么个层次。这篇进阶篇打算把“能用”提升到“用得省事省心”这个层次。一、gzip/deflate支持现在的网页普遍支持gzip压缩,这往往可以解决大量传输时间,以VeryCD的主页为例,未压缩版本2...

2012-07-20 15:08:00 131

转载 python crawler(1)

学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。-这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不

2012-07-20 15:07:30 4564

python crawler(1)

学用python也有3个多月了,用得最多的还是各类爬虫脚本:写过抓代理本机验证的脚本,写过在discuz论坛中自动登录自动发贴的脚本,写过自动收邮件的脚本,写过简单的验证码识别的脚本,本来想写google music的抓取脚本的,结果有了强大的gmbox,也就不用写了。 - 这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这个半爬虫半网站的项目,累积不少...

2012-07-20 15:07:00 87

原创 情感语料

http://www.searchforum.org.cn/tansongbo/corpus-senti.htm

2012-07-19 20:39:55 1027

情感语料

http://www.searchforum.org.cn/tansongbo/corpus-senti.htm

2012-07-19 20:39:00 191

转载 java正则替换标点

感谢【火龙果】,钦佩他的研究精神。http://topic.csdn.net/u/20080925/15/41b814bf-fcaf-4b37-be91-10561a102768.html测试代码如下:class T {  public static void main(String... args) {    String str = "!!!!去符号标号!!

2012-07-19 17:40:41 8509 1

java正则替换标点

感谢【火龙果】,钦佩他的研究精神。http://topic.csdn.net/u/20080925/15/41b814bf-fcaf-4b37-be91-10561a102768.html 测试代码如下:classT{publicstaticvoidmain(String...args){Stringstr="!!!!去符号标号!!当然。!!..**半角";System...

2012-07-19 17:40:00 287

转载 python debug【】

python 语言如何debug2012-04-04 22:09一直喜欢使用notepad++来写小规模的python脚本。喜欢这样快速的开发脚本,不过一旦遇到逻辑问题就抓瞎了。不知道该怎么debug 脚本,就只能一行一行的去分析什么地方出问题了。今天发现python怎么debug了,在python的用户手册上,lib手册的第24章,使用python -m pd

2012-07-19 16:10:29 5781

python debug【】

python 语言如何debug2012-04-04 22:09一直喜欢使用notepad++来写小规模的python脚本。喜欢这样快速的开发脚本,不过一旦遇到逻辑问题就抓瞎了。不知道该怎么debug 脚本,就只能一行一行的去分析什么地方出问题了。今天发现python怎么debug了,在python的用户手册上,lib手册的第24章,使用python -m pdb test...

2012-07-19 16:10:00 149

转载 python文件读写2

最基本的文件操作当然就是在文件中读写数据。这也是很容易掌握的。现在打开一个文件以进行写操作: 1. fileHandle = open ( 'test.txt', 'w' )  fileHandle = open ( 'test.txt', 'w' ) ‘w'是指文件将被写入数据,语句的其它部分很好理解。下一步就是将数据写入文件: 1. fileHandle.wri

2012-07-19 16:00:48 706

python文件读写2

最基本的文件操作当然就是在文件中读写数据。这也是很容易掌握的。现在打开一个文件以进行写操作: 1. fileHandle = open ( 'test.txt', 'w' ) fileHandle = open ( 'test.txt', 'w' ) ‘w'是指文件将被写入数据,语句的其它部分很好理解。下一步就是将数据写入文件: 1. fileHandle.write ( 'This is a t...

2012-07-19 16:00:00 91

转载 pythonGB2312乱码问题

unc = stringa.decode("gb2312")print unc.encode("utf-8")LovelyPython中的通用解决方案,使用chardet模块,该模块是用来检测目标编码的[python] view plaincopyimport chardet, os    def _smartCode(i

2012-07-19 15:52:20 5000

pythonGB2312乱码问题

unc = stringa.decode("gb2312")print unc.encode("utf-8") LovelyPython中的通用解决方案,使用chardet模块,该模块是用来检测目标编码的 [python]view plaincopy importchardet,osdef_smartCode(item):codedet...

2012-07-19 15:52:00 511

转载 EM index

http://www.cnblogs.com/rocketfan

2012-07-17 14:57:41 590

EM index

http://www.cnblogs.com/rocketfan

2012-07-17 14:57:00 139

转载 python路径文件api

1: os.listdir(path) //path为目录 功能相当于在path目录下执行dir命令,返回为list类型 print os.listdir('..') 2: os.path.walk(path,visit,arg) path :是将要遍历的目录 visit :是一个函数指针,函数圆形为: callback(arg,dir,fileList) 其中arg为

2012-07-17 08:50:13 968

python路径文件api

1: os.listdir(path) //path为目录 功能相当于在path目录下执行dir命令,返回为list类型 print os.listdir('..') 2: os.path.walk(path,visit,arg) path :是将要遍历的目录 visit :是一个函数指针,函数圆形为: callback(arg,dir,fileList) 其中arg为为传给walk的arg , ...

2012-07-17 08:50:00 90

算法与数据结构学习指导与习题解析

算法与数据结构学习指导与习题解析 pdf 王晓东

2012-04-12

memcache安装使用及原理

浅显易懂的memcached安装,原理分析,分布式算法等

2011-07-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除