- 博客(4)
- 收藏
- 关注
原创 抓取Js动态生成数据且以滚动页面方式分页的网页
当我们在进行数据抓取的时候,如果目标网站是以Js的方式动态生成数据且以滚动页面的方式进行分页,那么我们该如何抓取呢? 如类似今日头条这样的网站:http://toutiao.com/ 我们可以使用Selenium来搞定这件事情。Selenium的设计目的虽然是用于Web应用程序的自动化测试,但是却非常适合用来做数据抓取,可以非常简单地绕过网站的反爬虫限制,因为Selenium直接运行在浏览...
2015-11-08 23:21:33 346 1
原创 JetBrains注册码计算(IntelliJ IDEA 15.0注册码激活)
安装前修改时间为2099年等很多年后的时间点,安装后选择免费试用30天,然后退出idea,把时间修改回来,这样就可以成功注册了 如果之前使用过授权服务器等激活方式,不弹出试用界面,请到C:\Users\计算机用户名\.IntelliJIdea15\config目录下将idea15.key文件重命名为idea15.key.bak 或者使用在线激活: 注册时选择“License ser...
2015-11-04 00:44:20 739
原创 JAVA关键字替换
import java.util.ArrayList; import java.util.HashMap; import java.util.List; import java.util.Map; import org.apache.commons.lang3.StringUtils; /** * 关键字替换类 * */ public class Keywor...
2015-11-03 21:22:52 857
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人