爬虫
域名无法解析
这个作者很懒,什么都没留下…
展开
-
写入文件心得
在写入文件时,一定要写入一个临时文件,然后将源文件删除,再重命名临时文件为源文件。 因为在写入过程中,可能存在意外导致写入错误,例如程序突然停止,断电等! 这时候写入的文件,如果损坏了,之前写入的数据也就打不开了。 如果是临时文件损坏,上一步操作的文件还在,起码有一个回退的余地。 情景:写爬虫,需求是从文件中读入数据,抓取文件中URL,之前忘记加忽略的标记了,手贱强制停止了程序,改好运行报错,发现...原创 2018-09-26 10:47:52 · 107 阅读 · 0 评论 -
Jsoup使用注意事项
使用Jsoup选择器的时候,假如在Elements中的元素有完全相同的两个字段,就会合并为一条记录,导致获取size的时候,会相应的减少一个。原创 2018-09-23 00:01:46 · 265 阅读 · 0 评论