- 博客(3)
- 收藏
- 关注
原创 Jsoup网页内容抓取分析(1)
在Java 程序在解析HTML 文档时,大家应该晓得htmlparser 这个开源项目,我也是使用过,不过这个程序到了2006年就没有更新了。由于我的基础较差,对于扩展自定义的标签还是不太懂,还是有超时问题困扰,偶然的 机会中发现有jsoup,而且更新到了1.72版,使用起来还是很容易上手的。下面写些使用心得: jsoup is a Java library for wor...
2013-02-21 21:01:16 239
原创 MySQL中GBK与UTF-8的区别
在MySQL中,如果数据库只需要支持一般中文,数据量很大,性能要求也比较高,那么就最好选择GBK,因为相对于UTF-8而言,GBK占用的空间较 小,每个汉字只占2个字节,而UTF-8汉字编码需要3个字节,这样可以减少磁盘I/O、数据库cache,以及网络传输的时间,从而提高性能,相反,如 果数据库主要处理英文,则建议采用UTF-8,因为GBK对英文字符编码也采用2个字节,而UTF-8只需要一个字...
2013-02-11 17:53:25 343
原创 MySQL中Utf8_general_ci 和 utf8_unicode_ci的区别
对中、英文来说没有实质的差别。 utf8_general_ci校对速度快,但准确度稍差。utf8_unicode_ci准确度高,但校对速度稍慢。 如果你的应用有德语、法语或者俄语,请一定使用utf8_unicode_ci。 我自己一般用utf8_general_ci就够了,到现在也没发现问题。。。 ...
2013-02-11 17:51:52 168
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人