JAVA
文章平均质量分 58
jianzhanger
这个作者很懒,什么都没留下…
展开
-
Java调用C/C++编写的第三方dll动态链接库
最近在用weka做一个数据挖掘相关的项目,不得不说,weka还是一个不错的开放源代码库,提供了很多最常用的分类和聚类算法。在我的项目中要用到一个聚类算法,Affinity Propagation(AP),由多伦多大学的Brendan J. Frey发表于2007年。相比其他的聚类算法,AP算法的聚类结果更加准确。在AP的官方网站公布了AP算法的动态链接库,我的目标就是实现在Java工程中调转载 2013-11-19 09:23:12 · 3691 阅读 · 0 评论 -
使用Selenium来抓取动态加载的页面
原文:http://my.oschina.net/flashsword/blog/147334?p=1一般的爬虫都是直接使用http协议,下载指定url的html内容,并对内容进行分析和抽取。在我写的爬虫框架webmagic里也使用了HttpClient来完成这样的任务。但是有些页面是通过js以及ajax动态加载的,例如:花瓣网。这时如果我们直接分析原始页面的html,是得不到有效转载 2015-04-02 15:31:29 · 22268 阅读 · 0 评论 -
使用 jsoup 对 HTML 文档进行解析和操作
原文:http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/index.htmljsoup 简介Java 程序在解析 HTML 文档时,相信大家都接触过 htmlparser 这个开源项目,我曾经在 IBM DW 上发表过两篇关于 htmlparser 的文章,分别是:从 HTML 中攫取你所需的信息和 扩展转载 2015-04-02 15:34:44 · 483 阅读 · 0 评论 -
PhantomJS快速入门教程
原文:http://www.tuicool.com/articles/beeMNjPhantomJS 是一个基于 WebKit 的服务器端 JavaScript API。它全面支持web而不需浏览器支持,其快速,原生支持各种Web标准: DOM 处理, CSS 选择器, JSON, Canvas, 和 SVG。 PhantomJS 可以用于 页面自动化 , 网络监测 , 网页截屏转载 2015-04-03 10:11:12 · 3007 阅读 · 0 评论 -
推荐!国外程序员整理的Java资源大全
构建这里搜集了用来构建应用程序的工具。Apache Maven:Maven使用声明进行构建并进行依赖管理,偏向于使用约定而不是配置进行构建。Maven优于Apache Ant。后者采用了一种过程化的方式进行配置,所以维护起来相当困难。Gradle:Gradle采用增量构建。Gradle通过Groovy编程而不是传统的XML声明进行配置。Gradle可以很好地配合Maven进行依转载 2015-05-19 17:04:09 · 850 阅读 · 0 评论 -
页面有时无法输入中文的解决方案
原文地址:http://bbs.csdn.net/topics/370060405script language="javascript"> function switchIME(enable){ var root = document.getElementById("mead");转载 2015-06-09 11:14:29 · 1392 阅读 · 0 评论