- 博客(4)
- 资源 (6)
- 收藏
- 关注
转载 一种提取HTML网页正文的方法
package getContent;import java.io.IOException; import java.util.HashMap; import java.util.Stack;import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup
2016-11-17 21:10:44 1553
原创 [Anaconda2]Selenium+PhantomJS环境搭建
最近在学习python的js解析,发现使用Selenium+PhantomJS的方案还是比较适合我的,以下是环境配置教程。Selenium及PhantomJS介绍:Selenium是一个用于Web应用程序测试的工具,Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE、Mozilla Firefox、Chrome等。 Phantom JS是一个服务器端的 Java
2016-11-15 11:17:11 3657 1
原创 Window环境下使用IntelliJ IDEA调试Spark Application
最近在玩spark,每次敲完代码,就需要打成jar包上传服务器进行测试,所以比较繁琐,准备在window环境下使用IntelliJ IDEA搭建Spark调试环境。在window环境下先安装Spark环境: 安装jdk,建议1.8+,配置java环境变量。 下载Hadoop,并安装,配置环境变量,修改配置文件。 下载Spark,并解压缩至本地,我的版本是spark-2.0.1-bin-hadoop2
2016-11-03 17:33:44 4134
转载 Scala字符串处理常用函数
package com.agiers.util import java.io._ import java.nio.channels._ import java.nio._ import java.net.{ URLEncoder, URLDecoder } import com.spreada.utils.chinese.ZHConverter import scala.collection.
2016-11-01 20:50:33 4462
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人