- 博客(265)
- 资源 (99)
- 收藏
- 关注
原创 【使用JSOUP实现网络爬虫】处理URLs
问题你有一个包含相对URLs路径的HTML文档,需要将这些相对路径转换成绝对路径的URLs。方法在你解析文档时确保有指定base URI,然后使用 abs: 属性前缀来取得包含base URI的绝对路径。代码如下: Document doc = Jsoup.connect("http://www.open-open.com").get();Element link = doc.select("
2013-11-08 14:14:15
7456
1
原创 【使用JSOUP实现网络爬虫】从元素抽取属性,文本和HTML
问题在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据。方法要取得一个属性的值,可以使用Node.attr(String key) 方法 对于一个元素中的文本,可以使用Element.text()方法对于要取得元素或属性中的HTML内容,可以使用Element.html(), 或 Node.outerHtml()方法示例:String html =
2013-11-07 13:43:48
13240
原创 【使用JSOUP实现网络爬虫】使用选择器语法来查找元素
问题你想使用类似于CSS或jQuery的语法来查找和操作元素。方法可以使用Element.select(String selector) 和 Elements.select(String selector) 方法实现:File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http:
2013-11-06 16:36:58
9943
原创 【使用JSOUP实现网络爬虫】使用DOM方法来遍历一个文档
问题你有一个HTML文档要从中提取数据,并了解这个HTML文档的结构。方法将HTML解析成一个Document之后,就可以使用类似于DOM的方法进行操作。示例代码:File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/");Element
2013-11-05 15:23:47
8870
原创 【CSDN常见问题解答】用HTTPClient自动登录Tomcat管理页面
前提是你在你的tomcat-users.xml下配置好admin用户:<!-- Licensed to the Apache Software Foundation (ASF) under one or more contributor license agreements. See the NOTICE file distributed with this work for ad
2013-11-04 11:36:50
3848
原创 【使用JSOUP实现网络爬虫】从一个文件加载一个文档
问题在本机硬盘上有一个HTML文件,需要对它进行解析从中抽取数据或进行修改。办法可以使用静态 Jsoup.parse(File in, String charsetName, String baseUri) 方法:File input = new File("/tmp/input.html");Document doc = Jsoup.parse(input, "UTF-8", "http://
2013-11-03 22:23:21
4950
原创 解决fatal: No remote repository specified. Please, specify either a URL...
今天在电脑上用git pull命令来更新本地项目,突然发现出现如标题的错误:user ~/c/quhao$git pullfatal: No remote repository specified. Please, specify either a URL or aremote name from which new revisions should be fetched.出现这个问题的原
2013-11-03 18:16:00
38114
1
原创 【Android开发那点破事】打开APP加载页面实现
今天的破事呢就说说APP加载页面的实现。一般情况下,当APP打开的时候,我们需要做很多事情,比如检查网络连接啊,初始化一些配置啊等等。我们可以让这些事情在APP完全打开之前做完,然后呢在打开的过程中显示一些logo信息。想必大家都见过。先贴个运行效果:好,我们进入正题。首先我们先配置下AndroidManifest.xml在application节点里面添加一个自定义的activity:
2013-11-01 17:37:14
13387
原创 【使用JSOUP实现网络爬虫】从一个URL加载一个Document
存在问题你需要从一个网站获取和解析一个HTML文档,并查找其中的相关数据。你可以使用下面解决方法:解决方法使用 Jsoup.connect(String url)方法:Document doc = Jsoup.connect("http://example.com/").get();String title = doc.title(); 说明 connect(String url) 方法创建一
2013-10-30 14:28:05
12535
原创 【使用JSOUP实现网络爬虫】解析一个body片断
问题假如你有一个HTML片断 (比如. 一个 div 包含一对 p 标签; 一个不完整的HTML文档) 想对它进行解析。这个HTML片断可以是用户提交的一条评论或在一个CMS页面中编辑body部分。办法使用Jsoup.parseBodyFragment(String html)方法.String html = "Lorem ipsum.";Document doc = Jsoup.parseBo
2013-10-29 16:59:21
8549
原创 【使用JSOUP实现网络爬虫】解析一个HTML字符串
存在问题来自用户输入,一个文件或一个网站的HTML字符串,你可能需要对它进行解析并取其内容,或校验其格式是否完整,或想修改它。怎么办?jsonu能够帮你轻松解决这些问题解决方法使用静态Jsoup.parse(String html) 方法或 Jsoup.parse(String html, String baseUri)示例代码:String html = "First parse" + "P
2013-10-29 16:57:50
9423
原创 【使用JSOUP实现网络爬虫】入门:解析和遍历一个HTML文档
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。jsoup的主要功能如下:1. 从一个URL,文件或字符串中解析HTML;2. 使用DOM或CSS选择器来查找、取出数据;3. 可操作HTML元素、属性、文本;如何解析一个HTML文档:String html
2013-10-29 16:53:27
17289
原创 算法小题:m个相同的苹果,放在n个相同的盘子中,求有多少种结果
这也是回答问题的时候网友问的一个问题,m个相同的苹果,放在n个相同的盘子中,由于相同,使用排列组合的方法不好处理。这个解题思路很多。我这里讲其中一个比较好理解的解法:①最少的盘子放了一个,这样每个盘子至少一个,n个盘子先放上n个,剩下的m-n个可以随便放 ②最少的盘子没有放,这样剩下的n-1个盘子还是随便放m个 代码实现:import java.util.Scanner;public cl
2013-10-29 14:41:44
11323
原创 【CSDN常见问题解答】Java中JSON转XML
前几天在论坛上回答问题的代码,写下来记录下:import net.sf.json.JSONObject;import net.sf.json.xml.XMLSerializer;public class JSONToXml { private static final String STR_JSON = "{\"name\":\"Michael\",\"address\":{\"city\
2013-10-29 14:17:41
7999
原创 【Android开发那点破事】实现打电话功能
本期Android开发那点破事来聊聊如何调用系统提供的打电话功能,毕竟拨打电话才是手机最重要的功能。首先来看一个界面:这里有一个TextView,上面显示着电话号码。我们要实现点击这个电话号码就让手机自动拨打这上面的号码。 我已经做好了,先看下效果吧,点击电话号码,出现:可以看到我们已经拨打了这个号码了。下面跟着我的节奏,看代码如何实现:首先你需要在AndroidManifest.xml中加上打电
2013-10-22 17:02:20
12035
原创 【Android开发那点破事】解决Android模拟器超出屏幕问题
有时候用笔记本做Android开发,启动模拟器的时候发现Android模拟器的大小比桌面还大,无法看全整个屏幕,有木有。看下图:解决办法:1、点击run configuration2、切换到Target选项卡4、输入 -scale 0.8意思是按原大小的0.8倍显示。运行看图,终于可以看到全部模拟器了:注意:有时候关了模拟器,再运行发
2013-10-21 13:49:56
12071
原创 【CSDN常见问题解答】Web上传图片生成指定大小图片
在使用playframework的时候,发现框架提供了一个Image类,这个类可以实现生成指定大小的图片功能,我们来看下这个类: /** * Resize an image * @param originalImage The image file * @param to The destination file * @param w The
2013-10-20 22:21:37
7748
原创 【Android开发那点破事】Android判断SD卡状态
首先我们要在AndroidManifest.xml中增加SD卡访问权限: 接着我们写一个通用类来保存SD卡相关的操作及状态检查:import java.io.File;import android.os.Environment;import android.os.StatFs;public class SDTool { private static
2013-10-17 15:06:49
9981
原创 【Android开发那点破事】定制返回按钮的动画效果。
今天我们来讲一讲Andorid中如何定制返回按钮的动画效果。我将结合实际应用来阐述如何使用。首先来看一个效果截图,有一个搜索按钮在一个页面的顶部:我之前实现的方式是和百度/Google首页搜索的效果一样的,类似web开发中的ajax请求,结果直接在当前页面显示出来(下拉效果)。后来参考了众多APP之后发现都是进入到一个新的页面,所以我也就改过来试试。。废话说多了。。那我们点
2013-10-12 14:54:43
9346
2
原创 读取Jar包中的资源问题探究
最近在写一个可执行jar的程序,程序中包含了2个资源包,一个是images,一个是files。问题来了,在Eclipse里开发的时候,当用File类来获取files下面的文件时,没有任何问题。但是当程序导出为Runnable Jar时,运行程序时抛出异常,File not found。我们来一探究竟。首先是我的工程目录结构:程序中访问images下的图片代码:setIconIm
2013-09-23 11:38:33
22046
1
原创 【Android开发那点破事】自定义弹出框(搜索,登陆)
做过web开发的同学肯定知道,ajax查询结果的样式,比如google大神的首页效果:现在我们需要在Android中实现同样的效果。OK, follow me..首先来看下我已经实现好的效果。没输入关键字前:输入关键字a,返回所有结果,并且用一个弹出框显示所有结果:好了,我们来看下Android中如何实现展示列表弹出框:原理是监听textview的事件,当t
2013-09-20 13:35:54
8364
原创 【Java数据结构】Java数据结构之链表反转
我们都知道用C可以很简单的实现单链表反转,今天来学习下,在Java中如何实现链表反转。思路很简单,定义一个类,这个类分成2块,一块是表示自身的标志,另外一个存储指向下一个元素的引用。通过互换相邻两个节点的引用来达到链表反转的效果。上代码:package com.withiter.test;public class ReverseList { /** * @param args
2013-09-06 17:18:57
6841
原创 Apache 一台主机绑定多个域名及虚拟主机
今天研究了下Apache下如何使用一台主机绑定多个域名且使用80端口。说白了就是在一台主机上运行多个网站,并且网站域名都是使用的80端口。具体方法如下:1、进入Apache conf目录,找到httpd.conf,比如我的目录是:C:\Program Files (x86)\Apache Group\Apache2\conf。2、用记事本或者其他文本编辑器打开httpd.conf,找到
2013-08-20 15:12:57
5652
原创 iOS解析Server端返回JSON数据
在做quhao APP架构时,后台Server端使用了Java,提供WebService,而iOS和Android作为移动客户端。在做数据交互时,Server端返回JSON格式数据。由于iOS SDK中提供的JSON数据解析实在太过麻烦,这里讲下iOS下如何使用SBJson库来解析JSON格式数据。首先我发起了一个HTTP请求,得到一个response字符串,此字符串是JSON格式:NSURL
2013-07-23 22:31:40
6525
原创 Morphia 注解详解
1、@Entity 如果你想通过Morphia把你的对象保存到Mongo中,你首先要做的是使用@Entity注解你的类:import com.google.code.morphia.annotations.Entity; @Entity public class Hotel { ... } A、名称和构造方法你可以为你的MongoDBDBConllection设
2013-07-16 13:29:27
6926
原创 【Android开发那点破事】解决Andriod使用HttpURLConnection 失败问题
在Android的Activity中使用HttpURLConnection连接到服务端时抛出异常,Access denied。第一个想到是权限问题。然后就尝试将INTERNET权限加上:在Manifest中加上:还是抛异常!看异常信息,和StrictMode有关,想到和Android版本有关,然后在Activity中加上如下代码,问题解决:StrictMode.setThreadPol
2013-07-15 17:13:33
13127
原创 个人网站上线
网址:http://cross.withiter.com/花了2周业余时间,终于可以上线了。网站用的最简单的JSP + Servlet + MongoDB开发的。很简洁。贴几张截图吧:
2013-07-13 11:26:51
8257
1
原创 Xcode 4.6 + iOS 6免证书真机调试
虽然要支持正版,但是对于学习阶段99美元也是不小的开销。所以就此研究了下如何免证书真机调试。当然最终要把APP发布到AppStore时,还是需要这99刀的。好了,闲话少说,直接进入正题。本人破解环境:Xcode 6.3,iPhone 4(已越狱且通过Cydia安装了AppSync),并且亲测可用此iPhone进行真机调试。整体4部分:1.自己为自己颁发一个证书用于为生成的程序签名2
2013-07-09 23:49:13
7979
原创 Play!framework 项目部署到Tomcat
Play Framework有自带的服务器,也可部署到其他服务器上。这里讲解下如何将Play的项目部署到Tomcat。1.准备war包首先进入play目录:比如我的:cd C:\play-1.2.5\play-1.2.5然后利用命令:play war [项目所在绝对路径] -o [生成的war包名称(包括路径)]这里要注意生成的war包最好指定到其他目录,比如C盘根目录。
2013-07-09 17:44:27
13233
原创 JavaScript 回调(callback)函数
此文适合JavaScript入门级选手阅读,高手就可以飘过了。先扯点闲话。在中国,有这么一种现象:不管什么词或者概念,总会有些人把这些东西解释的神乎其神,貌似搞得别人听不懂就觉得自己很厉害的样子。其实不知道有多2。我个人比较崇尚简洁明了。什么词,什么概念,如果你能用简短的一两句话让大家听明白,这才是本事。好了,闲话不扯了,进入正题。在JavaScript里什么叫Callback“回调函数”
2013-07-03 16:31:43
15567
原创 Linux中如何让进程在后台运行
在Linux中,如果要让进程在后台运行,一般情况下,我们在命令后面加上&即可,实际上,这样是将命令放入到一个作业队列中了:$ ./test.sh &[1] 17208$ jobs -l[1]+ 17208 Running ./test.sh &对于已经在前台执行的命令,也可以重新放到后台执行,首先按ctrl+z暂停已经运行的进程,然后使用bg命令将停
2013-06-24 17:19:46
2823
原创 技术人员如何创业《四》—— 打造超强执行力团队
好的团队是创业公司成功的必要因素之一。差劲的团队会导致整个团队没有战斗力,互相算计,只看到自己的利益,永远做不成一个好的产品。优秀的团队整个团体非常有凝聚力,以公司的事业为自己的事业,各自发挥自己的特长并互相帮助对方,不计较个人短暂的得失努力把公司推向一个又一个高点。我想没有一个创业者不想建立这样的团队,但很多人想法是好的,为什么最终却达不到理想团队的效果呢? 要知道人的问题永远
2013-06-20 10:40:59
1737
1
原创 技术人员如何创业《一》—— 产品及想法
好文分享,下面是转载的,为什么我标记为原创文章呢,因为我将会对这几篇文章添加我自己的理解。先转过来:不得不说这是个浮躁的社会,人人在这个社会都想暴富或者成名。在这些引诱的驱使下很多人都脱离了原来的稳定工作创业。前几天看了《中国合伙人》,故事讲到了几个大学生从校园到工作、再到创办了一个伟大的企业,这个故事更加激励了创业大军的壮大。大家都想创业,那我们技术人员怎么创业?也就个人的经验分享一下:
2013-06-20 10:37:06
1958
原创 移动应用设计入门
随着智能手机、平板电脑的快速普及,越来越多的企业意识到建立自己的APP应用和移动网站,也有越来越多设计师开始转战移动平台。本篇主要介绍移动平台的一些入门知识和各平台的设计要求。 一、移动产品的实现方式移动产品的实现方式主要有三种:①Native App;② Web App;③ Hybrid App ① Native App指的是本地化应用,就是我们从应用商店下载安装的独立应用,
2013-05-24 17:24:05
2436
原创 Java - 通过IP地址获取用户所在地
最近在做一个互联网项目,不可避免和其他互联网项目一样,需要各种类似的功能。其中一个就是通过用户访问网站的IP地址显示当前用户所在地。在没有查阅资料之前,我第一个想到的是应该有这样的RESTFUL服务,可能会有免费的,也有可能会是收费的。后来查阅了相关资料和咨询了客服人员发现了一款相当不错的库:GEOIP。中文官网:http://www.maxmind.com/zh/home?pkit_lang
2013-05-19 08:28:52
15058
1
原创 Java类的生命周期
学习带复习,从原理上来了解下Java类的生命周期。首先来了解一下jvm中的几个比较重要的内存区域,这几个区域在java类的生命周期中扮演着比较重要的角色:方法区:在java的虚拟机中有一块专门用来存放已经加载的类信息、常量、静态变量以及方法代码的内存区域,叫做方法区。常量池:常量池是方法区的一部分,主要用来存放常量和类中的符号引用等信息。堆区:用于存放类的对象实例。栈区:也
2013-04-27 17:02:56
1799
原创 利用Java反射获取类的私有变量值
从设计的原则来说,类的成员变量如果设计成private,那么我们就不能在类外部去获取到此private变量的值。通常的做法是提供此private变量的get 和set方法。但是如果这个类没有提供get和set方法,我们如何去获取到这个类的private成员变量呢?比如有这么一个类 Person:class Person{ private String name = "cross";}我
2013-04-27 15:51:41
28951
1
原创 MongoDB GridFS图片存储
平时用MySql, Oracle的做图片存储的时候都是直接将文件上传到服务器并存储到硬盘固定目录下,表中只存储路径。现在用MongoDB,就学习了下MongoDB GridFS。MongoDB GridFS是mongodb的一个子模块,使用GridFS可以基于mongodb来持久存储文件.并且支持分布式应用(文件分布存储和读取).GridFS是mongodb中用户存储大对象的工具,对于mongod
2013-04-05 23:29:15
3910
原创 Windows 下 使用TortoiseGit GitHub
1. msysgitTortoiseGit依赖msysgit,首先下载:http://code.google.com/p/msysgit/downloads/detail?name=msysGit-fullinstall-1.8.1.2-preview20130201.exe&can=2&q=再下载TortoiseGit:http://code.google.com/p/tortoiseg
2013-03-08 13:13:21
4325
原创 playframework play deps超时
使用playframework时,使用play deps --verbos,无法下载相关的依赖包,错误信息如下:Server access Error: Connection timed out: connect url=http://www.playframework.org/modules/press-1.0.25.zip很明显是连接超时,解决方法如下:play deps YO
2013-03-06 15:03:06
2961
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅