- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 静态网页爬虫——2018/11/11
静 态 网 页 爬 虫 ——小说网站为例—— 环境: windows 7 idea 2018.2 jdk 1.8 思路: 获取带有章节链接的目录网页 通过正则表达式,得到每一篇的a标签 通过a标签拼接成每一篇文章的url 调用Jw方法,再次获取每篇文章的正文 通过正则表达式,得到标题和正文(正文由于正则表达式写的很差,后面用了字符串的拼接与替换) 总结...
2018-11-11 00:32:35 202
关于#centos#的问题,如何解决?
2023-02-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人