![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
学习机器人
robinliu2010
这个作者很懒,什么都没留下…
展开
-
一段MYSQL的插入代码
程序一:import java.io.File;import java.io.IOException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;public class cra原创 2012-05-09 22:45:45 · 807 阅读 · 1 评论 -
CSS 简介
http://www.w3school.com.cn/css/css_intro.asp转载 2012-05-20 07:39:38 · 391 阅读 · 0 评论 -
通过servlet来实现对Mysql进行连接、插入、修改、删除操作
通过servlet来实现对Mysql进行连接、插入、修改、删除操作来自:http://blog.sina.com.cn/s/blog_4bea2fb10100f3w3.htmlpackage Servlet;import java.io.IOException;import java.io.PrintWriter;import java.sql.SQLException;转载 2012-05-20 00:36:18 · 1935 阅读 · 0 评论 -
利用jsoup 如何从网页中下载图片
来自:http://www.open-open.com/bbs/view/1320576549952如何从网页中下载图片如果做为爬虫很有必要从网页中下载图片到本地,那么我们利用jsoup来进行该操作,jsoup 是一个很不错的html解析器。下面是它的简介:jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可转载 2012-05-20 00:46:32 · 791 阅读 · 0 评论 -
Jsoup 介绍
http://womendu.iteye.com/blog/867363今天给大家介绍一款强大的,方便的,基于Java的Html parser — Jsoup。相比于大家熟悉的HtmlParser,Jsoup显得更强大,更易用。如果你使用过Jquery的选择器,那么当你使用Jsoup时,你会感到是那么的亲切…Jsoup是一个方便于操作HTML的开源的java类库,基于MIT协议发布。其提供转载 2012-05-20 00:49:49 · 493 阅读 · 0 评论 -
java处理文本的方法
最初java是不支持对文本文件的处理的,为了弥补这个缺憾而引入了Reader和Writer两个类,这两个类都是抽象类,Writer中write方法是比较好费时间的,如果为了提高效率我们可以使用BufferedReader对Reader进行包装,这样可以提高读取得速度,我们可以一行一行的读取文本,使用readLine()方法。 BufferedReader br = new Buffered转载 2012-05-20 01:07:50 · 4137 阅读 · 0 评论 -
WORD的POI处理与原理
转载自罗刚老师的《解密搜索引擎技术实战》电子工业出版社 Word是微软公司开发的字处理文件格式,以“doc”或者“docx”作为文件后缀名。Apache的POI(http://poi.apache.org/)可以用来在Windows或Linux平台下提取Word文档。用POI提取文本的基本方法如下:public static String readDoc(InputStream is)转载 2012-05-20 07:34:57 · 11024 阅读 · 1 评论 -
浏览器如何解析HTML文档
http://liaozj.blog.51cto.com/3618860/673389浏览器在解析HTML文档时,会把HTML解析为一种称为文档对象模型(Document Object Model)的对象集合,简称DOM。DOM的结构是树状的。如果学过编程的话,对于“对象”和“树”的概念一定不陌生,不过如果没学过的话,那我还是要好好说说。对象是一个编程的概念,可以说是把一堆有关转载 2012-05-20 20:50:27 · 1831 阅读 · 0 评论 -
java遍历文件夹并复制文件到指定目录
转载:http://www.open-open.com/home/space-2869-do-blog-id-5781.html package com.czp;import java.io.BufferedInputStream;import java.io.BufferedOutputStream;import java.io.File;import java.io转载 2012-05-21 21:51:07 · 3840 阅读 · 0 评论 -
深入理解DOM
发现在进行网页爬取的时候,经常用到DOMhttp://www.w3school.com.cn/htmldom/index.asp上面这个网页有深入介绍,推荐给大家。 HTML 文档对象模型(HTML Document Object Model)定义了访问和处理 HTML 文档的标准方法。您应当具备的基础知识在继续学习之前,您需要对下面的知识有基本的了解:原创 2012-05-20 01:20:12 · 505 阅读 · 0 评论 -
通过JAVA获取优酷、土豆、酷6、6间房、56视频
http://www.iteye.com/topic/998790通过JAVA获取优酷、土豆、酷6、6间房、56视频,现在很多社会网站都有这个功能,用户输入优酷、土豆、酷6、6间房、56视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长。比如:新浪微博就有这个功能,当用户输入优酷、土豆、酷6、6间房、56视频网址后,就能获取到相应的视频地址及视频的缩略图。转载 2012-05-20 01:01:30 · 2977 阅读 · 2 评论 -
JSOUP简介
http://www.ibm.com/developerworks/cn/java/j-lo-jsouphtml/Java 程序在解析 HTML 文档时,相信大家都接触过 htmlparser 这个开源项目,我曾经在 IBM DW 上发表过两篇关于 htmlparser 的文章,分别是:从 HTML 中攫取你所需的信息和扩展 HTMLParser 对自定义标签的处理能力。但现在我已经不再使转载 2012-05-20 00:55:14 · 803 阅读 · 0 评论 -
学习POI处理word
为什么要用POI。因为POI是一款简单的,用于抽取word文档成string的开源java。一,下载POI首先从http://poi.apache.org/下载二进制发布包。 poi-bin-3.8-beta4-20110826.zip 二,解压三,在eclipse中新建一个java项目 导入日志相关的包commons-logging-1.1.jar、log4j-1.2.13原创 2012-05-09 19:50:15 · 1429 阅读 · 0 评论 -
Java读取文件方法大全
Java读取文件方法大全 2011-10-19 15:26:03| 分类:Java Web | 标签:java |字号大中小 订阅来自:http://junehuang111.blog.163.com/blog/static/62707220119193263382/1、按字节读取文件内容2、按字符读取文件内容3、按行读取文件内容4、随机转载 2012-05-09 23:00:09 · 309 阅读 · 0 评论 -
主题:jsoup使用
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。请参考:http://jsoup.org/ jsoup的主要功能如下: 从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找、转载 2012-05-20 00:51:47 · 440 阅读 · 0 评论 -
OPENNLP——java的NLP工具
Apache OpenNLP库是一个基于机器学习的自然语言文本处理的开发工具包,它支持自然语言处理中一些共有的任务,例如:标记化、句子分割、词性标注、固有实体提取(指在句子中辨认出专有名词,例如:人名)、浅层分析(句字分块)、语法分析及指代。这些任务通常都需要较为先进的文字处理服务功能[1][2]。 http://zh.wikipedia.org/wiki/OpenNLP ht转载 2012-06-01 22:42:27 · 7378 阅读 · 0 评论 -
学习机器人
框架——大框架,小框架 高频词 高频词语 高频词句 第一步,通过各种途径找到资源。一是文件系统;对目录中文件进行扫描,需要有递归。二是网上资源。 用JSOUP等,掌握JSOUP,还有网络流的技术等东东。 需要的并且可以看到的资源都能下下来,装进去。jsoup使用的三个步骤:一是解析为document;二是选择,selector;三是抽取,elem原创 2012-05-09 23:26:42 · 572 阅读 · 0 评论 -
JAVA对MYSQL进行连接、插入、修改、删除操作
来自http://blog.sina.com.cn/s/blog_4bea2fb10100f147.html JAVA对Mysql进行连接、插入、修改、删除操作。 数据库表单的创建 mysql> create database shuishengmu;Query OK, 1 row affected (0.00 sec) my转载 2012-05-20 00:27:17 · 639 阅读 · 0 评论 -
通过JAVA获取优酷视频
通过JAVA获取优酷视频,现在很多社会网站都有这个功能,用户输入优酷视频地址后,能找到对应的视频及视频的缩略图,有些社区网站还能获取到视频的时长。 比如:新浪微博就有这个功能,当用户输入视频网址后,就能获取到相应的视频地址及视频的缩略图。 Java代码 http://www.iteye.com/topic/984220import java.io.IOExcepti转载 2012-05-20 00:59:00 · 2322 阅读 · 1 评论 -
JAVA操作字符集
mysql4.1.2的默认字符集是latin1,latin1属于ISO8859-1的子集(或者是一回事?),写入时需要为iso8859-1的编码,读出时要转换成gbk编码,就不会是乱码。 Class.forName("org.gjt.mm.mysql.Driver"); String url ="jdbc:mysql://localhost/mysql"; Connection转载 2012-05-20 00:38:47 · 305 阅读 · 0 评论 -
MySQL5中文乱码解决5
这是最近一个很挠头的MySQL5中文乱码问题的解决方法,尝试了多位网友的建议后总算解决,短短两句话,记录如下: 1.编辑/etc/my.cnf ,在[mysql]段加入default_character_set=utf8 2.在编写Connection URL时,加上?useUnicode=true&characterEncoding=utf-8参数转载 2012-05-20 00:40:06 · 283 阅读 · 0 评论 -
使用java语言操作,如何来实现MySQL中Blob字段的存取
/** * Title: BlobPros.java * Project: test * Description: 把图片存入mysql中的blob字段,并取出 * Call Module: mtools数据库中的tmp表 * File: C:downloadsluozsh.jpg * Copyright: Copyright (c) 2003-2003 * Compa转载 2012-05-23 22:24:10 · 6100 阅读 · 0 评论