2015.3.31
问题:html模块扫描后发现内存不断增加,调试发现停在readtoend处,查看发现网址是一个可以下载的文件,原来程序一直在下载那个文件到内存导致内存一直暴增。
解决方案:判断httpwebrespon.ContentLength的大小,大于1048576即1M的为文件,自动跳出,不对其进行网页源代码获取。有时httpwebrespon.ContentLength是不存在的,故要加个条件webResponse.ContentLength != null && webResponse.ContentLength > 1048576,从而避免一些特殊情况崩溃