自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(476)
  • 资源 (1)
  • 收藏
  • 关注

原创 熔岩的相关文章收藏

HttpClient4 Post XML到一个服务器上纯Java文件操作工具,支持文件、文件夹的复制、删除、移动山寨版Log4jJava反射深度测试深入理解HTTP Session深入理解ServletRequest与ServletResponseJava字符编码根本原理Servlet接收JSP参数乱码问题解决办法JDBC数据源(DataSource)的简单实现...

2011-02-20 21:57:00 245

原创 老王的Python教程-推荐

强烈推荐,适合入门,适合深入http://www.cnpythoner.com/

2011-02-02 22:46:55 465

原创 转贴一篇不错的Python入门教程 - Instant Hacking[译文]

原文 http://www.hetland.org/python/instant-hacking.php Instant Hacking[译文] 译者: 肯定来过                                       这是一篇简短的关于python程序设计语言的入门教程,原文在这里,翻着词典翻译了来! 这是一份对编程艺术的简短介绍,其中的例子是用python写成的。(如果你已...

2011-02-02 00:09:16 286

原创 python快速入门教程

python所支持的数据类型:整型、长整型、布尔型、浮点型、复数、字符串、列表(list)、元组(Tuple)、字典(Dict)、objectpython能支持理论意义上的长整型,如C#中的长整型是Int64,即最大值为2的64次方,而python中的长整型只与机器的虚拟内存大小有关,你完全不用考虑溢出这样的异常。python是一种动态语言,虽然在定义变量时无需定义变量的类型,...

2011-02-01 23:41:15 303

原创 python入门教程:语句和语法

注释(#):python中的注释是以#开头的,不像c++中有/**/之类的多行注释。继续():表示继续上一行,通常情况下,一行表示一个语句,一行过长的语句可以使用进行分解语句块(:):在c#/php/javascript/c++中,对于复合语句是用{}来标识,而在python中,是用:配合缩进来实现语句块,如:if a>0:#todoelse:#todo...

2011-02-01 23:40:44 219

原创 python教程:安装python运行环境以及简单程序

python3.0已推出,但据说很多库都不能用了,建议使用2.6版本,我目前使用的是2.5版,与2.6版差距不大。注意:2.6版本开始,print需要加上括号,否则会提示语法错误。安装python运行环境:下载for windows的安装包,http://www.python.org/,不过,正式对外的下载地址被和谐了,请移步到这里下载:http://www.python.o...

2011-02-01 23:38:14 514

原创 利用Python抓取和解析网页(二)补充

五、为HTML文档中的属性值添加引号  前面我们讨论了如果根据HTML解析器中的某种处理程序来解析HTML文件,可是有时候我们却需要使用所有的处理程序来处理HTML文档。值得庆幸的是,使用HTMLParser模块解析HTML文件的所有要素并不比处理链接或者图像难多少。  import HTMLParser  import urllib  class parseAttrs(H...

2011-02-01 23:34:00 129

原创 利用Python抓取和解析网页(二)

 对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文上篇中,我们介绍了一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块。在本文中,我们将论述如何使用Python模块来迅速解析在HTML文件中的数...

2011-02-01 23:31:45 457

原创 利用Python抓取和解析网页(一)

对搜索引擎、文件索引、文档转换、数据检索、站点备份或迁移等应用程序来说,经常用到对网页(即HTML文件)的解析处理。事实上,通过Python语言提供的各种模块,我们无需借助Web服务器或者Web浏览器就能够解析和处理HTML文档。本文将详细介绍如何利用Python抓取和解析网页。首先,我们介绍一个可以帮助简化打开位于本地和Web上的HTML文档的Python模块,然后,我们论述如何使用Python...

2011-02-01 23:25:46 396

我新弄的博客和论坛+新浪微博

 主博客是:http://www.liuxinglanyue.com/ 主论坛是:http://bbs.liuxinglanyue.com/   论坛崩溃掉了。               这个论坛已于2011-2-18日恢复。 欢迎对论坛的版块设置提供改进意见,谢谢。 同时也欢迎在论坛里交流技术。 这里有个论坛:http://java.liuxingla...

2011-02-01 00:05:23 125

对2010年的总结

        我的博客:http://www.liuxinglanyue.com/        欢迎来踩。        其实谈不上总结,而是生活的一段剪影。        直到昨天晚上,我注册的域名(liuxinglanyue.com)终于和博客绑定了。这中间还是遇到了不少问题,不过最终都被我消灭了(当然是非常兴奋了,哈哈)。        首先说说域名的事。考操作系...

2011-01-31 16:11:13 109

原创 海量数据算法收藏

1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url?       方案1:可以估计每个文件安的大小为50G×64=320G,远远大于内存限制的4G。所以不可能将其完全加载到内存中处理。考虑采取分而治之的方法。        (1)遍历文件a,对每个url求取clip_image002,然后根据所取得的值将url分别存储到1...

2011-01-28 14:21:24 122

原创 Java深度历险(收藏)

Java深度历险(一)——Java字节代码的操纵Java深度历险(二)——Java类的加载、链接和初始化  

2011-01-12 16:13:45 109

原创 关于Web推荐系统的一些博客资料

A.关于推荐系统的综述说明推荐系统:主要推荐方法电子商务推荐系统入门基础电子商务推荐系统研究综述Collaborative Filtering为什么基于项目的协同过滤是稳定的.个性化推荐系统的研究进展[和朋友一起写的小综述]推荐系统:协同过滤之user-based collaborative filtering数字化信息服务中个性化与共享理念分析...

2011-01-11 15:43:49 183

原创 深入浅出 Java Concurrency

转自: J.U.C 整体认识原子操作 part 1 从AtomicInteger开始原子操作 part 2 数组、引用的原子操作原子操作 part 3 指令重排序与happens-before法则原子操作 part 4 CAS操作锁机制 part 1 Lock与ReentrantLock锁...

2011-01-08 23:00:52 207

原创 Myeclipse 8.5 配置SVN

参考:http://www.cnblogs.com/ewyb/archive/2010/10/20/1856785.html

2011-01-08 14:49:46 112

原创 算法导论第 3 版之多线程算法-开头部分(带图版)

转自:http://blog.csdn.net/hoping/archive/2010/02/25/5326354.aspx本书中的主要算法都是顺序算法 ,适合于运行在每次只能执行一条指令的单处理器计算机上。在本章中,我们要把算法模型转向并行算法 ,它们可以运行在能够同时执行多条指令的多处理器计算机中。我们将着重探索优雅的动态多线程算法模型,该模型既有助于算法的设计和分析,同时也易于进行高...

2011-01-08 11:19:19 379

原创 算法导论第 3 版之多线程算法

 转载的文章中没图,这里补充下:http://liuxinglanyue.iteye.com/admin/blogs/865784   算法导论第 3 版之多线程算法(—)     算法导论第 3 版之多线程算法(二)    算法导论第 3 版之多线程算法(三)      算法导论第3版新增第27章:多线程算法(完整版)   ...

2011-01-08 10:59:46 191

原创 《算法导论》读书笔记(收藏)

《算法导论》读书笔记1(算法入门) 《算法导论》读书笔记2(复杂度的表示,递归,以及概率) 《算法导论》读书笔记3(堆排序) 《算法导论》读书笔记4 (快速排序) 《算法导论》读书笔记5(线性时间排序) 《算法导论》读书笔记6(中位数和顺序统计学) 《算法导论》读书笔记7 (散列表)  ...

2011-01-07 15:40:58 891 1

原创 Java编程思想 (收藏)

1、面向对象的特性 2、内存分配 3、基本类型 4、操作符 5、流程控制 6、初始化与清理 7、访问权限控制 8、复用 9、多态 10、接口 11、内部类 12、内部类(多继承) 13、内部类(闭包与回调) 14、内部类(再论工厂模式) 15、异常 16、字符串 ...

2011-01-07 15:34:01 124

原创 Java解惑系列(收藏)

 1.1 java解惑你知多少(一)1.2 java解惑你知多少(二)1.3 java解惑你知多少(三)1.4 java解惑你知多少(四)1.5 java解惑你知多少(五)1.6 java解惑你知多少(六)1.7 java解惑你知多少(七)1.8 java解惑你知多少(八)...

2011-01-07 15:30:39 81

原创 搜索引擎技术二(帖子收藏)

  网络爬虫技术 搜索引擎算法研究 搜索引擎分类与工作原理 搜索引擎排名的作用及搜索引擎排名的商业价值 Hadoop笔记--不需要分布式编程经验地分布式编程 什么是Heritrix-开源crawler 开发垂直门户的分布式搜索引擎系统 nu...

2011-01-05 20:02:54 120

原创 搜索引擎技术一(帖子收藏)

  利用Sphinx实现实时全文检索 基于Sphinx构建准实时更新的分布式通用搜索引擎平台 尝试使用IKVM运行Lucene 2.9.0版 中文分词的整理 Apache Lucene 2.9的改进 Scrapy 轻松定制网络爬虫 如何识别搜索引擎爬虫的真伪...

2011-01-05 20:01:44 162

原创 Google Python 视频教程

Google Python Class Day 1 Part 1 Google Python Class Day 1 Part 2 Google Python Class Day 1 Part 3 Google Python Class Day 2 Part 1 Google Python Class Day 2 Part 2 Google Python C...

2011-01-04 08:39:43 701 1

原创 Redis: under the hood(收藏)

Redis: under the hoodHow does the Redis server work?I was curious to learn more about Redis’s internals, so I’ve been familiarizing myself with the source, largely by reading and jumping aroun...

2011-01-03 10:54:25 141

原创 编译原理(第2版)勘误表

今天刚买了这本书,顺便提供一下勘误表。来自:http://infolab.stanford.edu/~ullman/dragon/errata.html此书网站 http://dragonbook.stanford.edu/  Errata for Compilers: Principles, Techniques, and Tools, Second Edition...

2011-01-02 14:46:17 444

原创 Django学习笔记(收藏)

 Django笔记1 Django笔记2 Django笔记3 Django笔记4 Django笔记5(管理站点) Django笔记6(表单处理) Django笔记7(通用视图) Django笔记8(模板引擎) Django笔记9(会话、用户和注册) Django笔记10(缓存机制) Django笔记11(...

2011-01-01 15:43:17 362

原创 Redis指令文档(非常有用的)

连接控制QUIT 关闭连接AUTH (仅限启用时)简单的密码验证适合全体类型的命令EXISTS key 判断一个键是否存在;存在返回 1;否则返回0;DEL key 删除某个key,或是一系列key;DEL key1 key2 key3 key4TYPE key 返回某个key元素的数据类型 ( none:不存在,string:字符,list,set,zset,hash)KEYS patt...

2011-01-01 15:32:26 306

原创 用Redis存储好友关系-python版

这是一个用Redis存储好友关系的python下使用Redis的例子。作者是Eric Florenzano (@ericflo)。相信对各位人生苦短用python的同学是一个好的入门例子。例子说明:其中虽然用了follow和block等字眼,但是他的关系不是一个微博系统的单向关注,而是类似SNS的双向关系。 """I've been thinking lately about h...

2011-01-01 11:56:06 388

关于Google的那点事 2011预言及回望

 GOS又按照惯例放出了他们对2011年Google的预测:1. Google Docs会提供更多免费存储空间,至少会有20GB。  2. Gmail会进化到HTML 5,读取速度更快,支持离线邮件存储,并完全整合其它Google Apps组件,比如Google Calendar和Google Docs。  3. Android内置的键盘会整合Google Scribd,提供输入建议。...

2011-01-01 11:02:34 125

原创 学习MySql技术博客推荐

分类MySQL优化设计 (62)MySQL初级应用 (61)MySQL基础知识 (79)MySQL解错方案 (41)MySQL高级应用 (30)未分类 (13)Handler-Socket Plugin for MySQL – SQL的功能、NoSQL的性能DRBD+Heartbeat让MySQL提供的服务更加稳定...

2011-01-01 10:45:30 147

原创 关于Lucene的讨论

分类为[lucene]的文章Lucene如何实现分页,如何显示从1到10,或者从11到20的结果?如何写Lucene的分析器?Lucene下如何更新一个或一组已经索引的文档?Lucene下如果不优化索引,删除的文档什么时候真的能被删除?Lucene下如果打开IndexWriter,优化索引,然后关闭IndexWriter,会发生什么?...

2011-01-01 10:20:21 79

Google美女副总裁:女子也能做极客

  相信很多人都知道Google副总裁Marissa Mayer,这位美女在Google这个顶级搜索公司的地位不容小觑。Mayer近日在接受采访时谈到了两性择业问题,她认为女性也可以从事IT工作,希望能通过自己的努力帮助打破女性不适合科技类工作的偏见。为什么在技术行业女性从业人员非常少?Mayer:我喜欢技术,我认为这不应该以性别做分界线,想要在这个行业消除性别歧视还有很多努力需...

2010-12-31 21:52:22 164

个人团队企业技术博客收录(不断更新)

IBM技术文档库 阿里巴巴(软件)开发者博客淘宝数据平台与产品部官方博客搜索引擎研究团队 车东[Blog^2]阿里巴巴数据仓库 笔记 by 车东Apache 下载点 人人镜像 Spring 官方论坛淘蝌蚪深沉的船  yiihsia[互联网后端技术]J2EE学习备忘录熔岩 pagefault新浪开发者博客福林雨 ...

2010-12-31 15:33:26 247

原创 Webdis – 为 Redis 提供 HTTP 接口

Redis 一直以来只提供纯文本操作协议(只有在 Cluster 中应用了二进制协议),这可能令很多推崇 RESTFul 的同学感觉不爽了,最近,一位同学业余开发了一个支持 HTTP 协议的 Redis Proxy,取名Webdis。其在Redis 的讨论区一发布,则引来一遍赞扬之声。下面是其简单使用例子:Webdis 在安装运行上秉承了 Redis 的极简主义,只需要 make 一...

2010-12-31 09:24:30 1060

原创 Lucene 学习总结(收藏)推荐

Lucene学习总结之一:全文检索的基本原理 Lucene学习总结之二:Lucene的总体架构 Lucene学习总结之三:Lucene的索引文件格式 (1) Lucene学习总结之三:Lucene的索引文件格式 (2) Lucene学习总结之三:Lucene的索引文件格式 (3) Lucene学习总结之四:Lucene索引过程分析(1) Lu...

2010-12-30 20:54:50 178

原创 重构方法实战(收藏)

重构方法(2) - 内联方法重构方法(3)- 用查询方法代替临时变量重构方法(4) - 引入解释性变量重构方法(5) - 分离临时变量重构方法(6) - 去除对参数的赋值重构方法(7) - 用方法对象代替方法重构方法(8) - 移动方法重构方法(9) - 移动字段重构方法(10) - 提取类重构方法(11) - 内联类 重构方法(12) – 隐藏委托类重...

2010-12-30 16:48:45 151

原创 计算Java对象占用内存空间的大小(对于32位虚拟机而言)

参考文档:http://liuxinglanyue.iteye.com/blog/855907http://www.developersky.net/thread-97-1-1.html Sizeof.java package com.liuxinglanyue;public class Sizeof{ public static void runGC (...

2010-12-30 16:23:09 171

原创 Java对象占用内存空间的大小

转自:it民工基本数据的类型的大小是固定的,这里就不多说了。对于非基本类型的Java对象,其大小就值得商榷。在Java中,一个空Object对象的大小是8byte,这个大小只是保存堆中一个没有任何属性的对象的大小。看下面语句:Object ob = new Object(); 这样在程序中完成了一个Java对象的生命,但是它所占的空间为:4byte+8byte。4byte...

2010-12-30 15:16:41 541

原创 基于Lucene的Compass 资源(收藏)

1.2、Compass相关网上资源 1、官方网站1: http://www.opensymphony.com 2、官方网站2:[url] http://www.compass-project.org[/url] 3、官方社区:http://forum.compass-project.org 1.3、相关文章 1、《Compass指南》 作者:江南白衣 http://wiki.springside....

2010-12-29 18:29:50 112

最大公约数和最小公倍数

简单便捷 很好懂 这是一个不错的资源

2008-11-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除