- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 关于新浪博客内容的抓取,weibo.com/ssclhb 这里面没有上一页和下一页怎么处理?
各位大神们好,我想完全的获取新浪博客里面的内容。网页如下: 新浪提供了一个HTTPS格式,用于电脑访问。https://www.weibo.com/ssclhb 另一个是HTTP格式,用于手机访问。https://weibo.cn/ssclhb 手机端的由于有上一页和下一页还好程序控制。对于没有上一页和下一页的,只有用滚轮到底才继续加载的,你们怎么处理? 还有,近期分析一个站的时候发现,里面的源码只有20十行,但是介绍和图片等全看不到。只有用检查才可以看到真正的源码,这种数据怎么获取? ...
2020-06-09 00:08:41 244
原创 大数据时代,数据的无比珍贵。
以前对于大数据的认识和概念是非常模糊的,没有感觉出来商业和经济价值。只看到理论的讨论,现在随着网络经济的发展和自己个人认识的提高,慢慢有了一定的了解。但是,现在数据的获取成了问题。 高效、稳定的数据源找不到了,唉,以前摆在眼前的数据源。现在不好搞了! hengda.homehappiness.cn linyifangchan.homehappiness.cn 用的全是大数据的理论,可是怎么能转换成对应的商业价值。那又是一门学问了 现在的数据防爬、验证码登陆、低部源码的展示,好像一切全都成了拦路虎。
2020-05-31 12:31:13 353
原创 ai-tb.cn 这里面的数据就该都是淘宝的,现在去哪抓取?
淘宝店铺大全 http://ai-tb.cn/ 网站地图:http://ai-tb.cn/sitemap.xml
2020-05-26 08:49:27 336
原创 如何通过自编PHP输出类似 http://ai-tb.cn/sitemap.xml 的网站地图
现在需要做一个小站,看到http://ai-tb.cn/sitemap.xml里面的地图应该是网站地图生成器的。想用PHP做一个,并且能够做到实时更新,大神们谁有相关范例。麻烦提供一下。
2020-05-26 08:42:22 137
最新版手机归属地查询接口 asp
2009-12-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人