- 博客(1)
- 资源 (11)
- 收藏
- 关注
原创 Netty实战-如何在web项目中对接第三方tcp协议
公司有一个专门用于对接第三方停车,crm,erp等等业务系统的项目由我负责,十几个场子全都是基于Http实现的,突然有一天实施告诉我有一个基于TCP协议实现的停车系统要接入。坦白讲,最开始我是拒绝的,因为我很难接受要引入一个这么难以维护,并且很大程度上会破坏原有系统边界的玩意,架不住人家就是强势,我就是不换车厂,你爱接不接,没办法,只能硬着头皮想办法上 1.坑爹的需求 停车这玩意跟crm,erp还...
2020-04-24 22:48:06 1466 1
定时任务框架
使用springboot搭建的一个定时任务框架,具有增,删,改,查,启动,暂停任务的功能,前端页面使用react+antd搭建,详细介绍:
https://blog.csdn.net/qq_35488769/article/details/83628374
2018-11-02
58同城二手房出售信息
爬自58同城的216W条二手房数据,从mongoDB中导出的json文件,包含的字段有
1.详情页面url
2.房屋朝向
3.房屋房间数量(类似两室一厅这种)
3.from url
4.经纬度
5.字符串地址
6,爬取时间(时间戳格式)
7.所属城市(类似湖北武汉这种)
可以用于大数据分析,机器学习等等,欢迎下载(未压缩前文件大小为700M,一般的文本编辑器无法打开)
2017-12-14
爬取一个用户的所有微博
利用selenium+PlantomJS登录+爬取感兴趣的用户的所有信息
包括昵称,认证,粉丝,关注,所有微博以及每条微博的转发,评论数量等
理论上来讲再加一个链接爬虫可以爬取新浪微博的所有数据
但是由于用的是无壳浏览器导致登录和加载页面速度比较慢
所以实际上基本不可能能实现爬取
代码写完调通就没有管过了,也没有优化过,不过基本的功能都可以实现
2017-06-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人