android中有是需要抓取网络Html页面中的一些基础数据,title,decription等等,用来展示网页基本信息。
github上开源项目https://github.com/LeonardoCardoso/Android-Link-Preview
原理就是将HTML加载下来,处理成字符串,使用正则表达式,查找<meta>标签,并使用HashMap分别保存起来。
自己写了个demo。安装后需要从浏览器分享一个页面到demo,查看解析的Log即可。
https://github.com/xueqin123/TextCrawler点击打开链接