经过这两天对正则表达式以及网友一些分享资料的学习,今天终于写出了抓取股票数据挖掘的程序了,虽然大部分借鉴了一位网友的思路,但是也经过自己学习消化和封装整理,尤其是正则表达式方面(?=等特殊结构,网上资料很少,我会贴出几个特殊的正则表达式结构以供后来者学习)。
其实很简单,因为现在只是简单的抓取信息,仅是开始。不多说,分享一下封装好的代码(可直接复制,然后在main函数调用就行了)
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
/**
* 抓取网络数据的类
* 数据位 : 日期、开、高、收、低、交易量(交易金额)
* @author Administrator
*
*/
public class StockDataMining {
private static String myStr="http://money.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/";
/*完整链接如:http://money.finance.sina.com.cn/corp/go.php/vMS_MarketHistory/stockid/" +