- 博客(2)
- 资源 (7)
- 收藏
- 关注
转载 网页正文抽取中的网页编码字符集自动识别最佳方案 .
易尔译科技(http://www.12fanyi.cn)团队过去在做正文抽取的时候经常会碰到因为网页字符集编码不同,抽取了很多乱码,现将一些文章收集整理一下,供新手参考,高手就别见笑了。 第一篇来自http://www.cnblogs.com/lersh/archive/2008/07/09/1238799.html《比IE准确率更高的自动字符集检测类 UniversalCharDet 》,
2012-01-07 01:05:33 2318
转载 用.NET 抓取一个页面
/// 02 /// Get a response as a string, given a uri string. 03 /// 04 /// Specifies a uri such as "http://www.google.com" or @"file://X:\dir\myFile.html" 05 /// web response as a
2012-01-07 00:45:20 962
Sybase IQ 官方文档(Sybase参考手册)
2010-12-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人