实现爬取“淮师新闻网”的新闻列表、新闻详情信息,并将爬取到的信息存入数据库。
- 可以抓取非HTML信息(HttpClient):例如网页上动态加载的Json信息
- 可以抓取多媒体信息,存入本地数据库:例如图片
- 使用C3P0连接池
- 使用DbUtils简化JDBC代码
- 使用多线程提高爬取效率
- 线程之间合理的通讯
Java代码,数据库信息,要导入的jar包,全都在
链接:https://pan.baidu.com/s/13qTTt0pDvLvUmrprD5Ehtg
提取码:19hf
能用点个赞