爬虫
文章平均质量分 93
万无引力 WY
何以解忧 唯有专注
展开
-
2018 02 11 告别选择困难症——webmagic爬虫爬取拉勾网职位信息
我好久没来csdn写文章了,为什么呢?说句实话,其实不是自己不来写文章了,而是自己太关注形式化的东西了,有一段时间把文章写在github上面,感觉有自己的站点很特殊,很与众不同。其实用github来写文章确实是很不错的,使用mackdown标记语言给人一种高效编写的感觉。所以打算好好利用这两个平台,csdn的简洁性,可以让自己在使用windows系统时写一写技术文章同时很好地与他人进行评论交流。在...原创 2018-02-11 23:36:33 · 10110 阅读 · 7 评论 -
java词云推荐(KUMO)
hello,各位,大年初二,给大家拜年了! 今天给大家介绍一下,使用java生成词云的方法和框架——KUMO(来自github),KUMO是一款使用java编写,应用于词频分析,词云生成的开源技术。不过应用不算广泛,毕竟现在python生成词云wordcloud太方便了,KUMO的出现方便了更擅长使用java的同学。那好,下面做简单介绍: 1.准备词语文本:实例如下 您可能会问,这么多词...原创 2018-02-17 13:00:51 · 15136 阅读 · 9 评论 -
Ubuntu18.0.4 安装 pgadmin4 远程连接 (自用)
最近接了个爬虫项目,需求很简单,就是爬一下速卖通的网站,不过要求是每天固定时间爬取,而且听说反爬虫机制很变态。由于客户的数据库放在公司的服务器上,所以只能使用pgadmin4等类似的数据库gui远程连接上,毕竟如果连都连不上的话 ,就算爬虫写出来也没有用。 简单介绍下 ubuntu安装pgadmin4的操作 注意:希望使用python3环境 ,因为python3环境直接支持pgadmin4的环...原创 2019-01-19 08:08:58 · 1460 阅读 · 0 评论