【实例简介】
使用java代码基于MyEclipse开发环境实现爬虫抓取网页中的表格数据,将抓取到的数据在控制台打印出来,需要后续处理的话可以在打印的地方对数据进行操作。包解压后导入MyEclipse就可以使用,在TestCrawTable中右键运行就能看到抓取到的数据。其他的调试可以自行修改。
【实例截图】
【核心代码】
63fc0890-e6e2-4709-ac6b-6fc4f2fee386
└── PanChongTest
├── bin
│ ├── chardet.jar
│ ├── com
│ │ └── panchong
│ │ └── test
│ │ ├── DataTableUtil.class
│ │ ├── PropertyInfo.class
│ │ ├── SimFeatureUtil.class
│ │ ├── StringUtil.class
│ │ ├── TableElement.class
│ │ ├── TableUtil.class
│ │ └── TestCrawTable.class
│ ├── commons-lang.jar
│ ├── commons-logging.jar
│ ├── cpdetector.jar
│ ├── httpclient-4.2.5.jar
│ ├── httpcore-4.2.4.jar
│ └── jsoup-1.7.2.jar
├── lib
│ ├── chardet.jar
│ ├── commons-lang.jar
│ ├── commons-logging.jar
│ ├── cpdetector.jar
│ ├── httpclient-4.2.5.jar
│ ├── httpcore-4.2.4.jar
│ └── jsoup-1.7.2.jar
└── src
└── com
└── panchong
└── test
├── DataTableUtil.java
├── PropertyInfo.java
├── SimFeatureUtil.java
├── StringUtil.java
├── TableElement.java
├── TableUtil.java
└── TestCrawTable.java
10 directories, 28 files