正则表达式分析网页,获得中央一电视节目列表

None.gif String strUrl = " http://www.cctv.com/tvguide/11/01/20061010/1.shtml " ;
None.gif
None.gif    
byte [] pageHtml  =  HttpUtil.getPage(strUrl);
None.gif    
// 将页面转成string
None.gif
    String strHtml  =    new  String(pageHtml,  " GB2312 " ); 
None.gif    String[][] ls
=   null ;
None.gif    ls 
=  StringUtil.splitByReg(strHtml, " (\\d{2}:\\d{2}:\\d{2})</font>.*<font >(.+)</font>.*</tr>\\r\\n<tr> " );
None.gif    
for ( int  i = 0 ;i < ls.length;i ++ )
ExpandedBlockStart.gifContractedBlock.gif    
dot.gif {
InBlock.gif        
//String[] ls1[] = StringUtil.splitByReg(ls[i],"");
InBlock.gif
        System.out.print(ls[i][0]+"##"+ls[i][1]); 
InBlock.gif        System.out.println();
ExpandedBlockEnd.gif    }
ExpandedBlockStart.gif ContractedBlock.gif /** */ /**通用正则表达式解析函数
InBlock.gif     * splitByReg  
InBlock.gif     * 
@param str 需要解析的字符串
InBlock.gif     * 
@param regExp  匹配的正则表达式
InBlock.gif     * 
@return 解析后字符串数组
ExpandedBlockEnd.gif     
*/

ExpandedBlockStart.gifContractedBlock.gif    
public   static  String[][] splitByReg(String str,String regExp)  dot.gif {
InBlock.gif        Pattern sp 
= Pattern.compile(regExp);
InBlock.gif        Matcher matcher 
= sp.matcher(str); 
InBlock.gif        Vector
<Vector<String>> colInoput= new Vector<Vector<String>>();
ExpandedSubBlockStart.gifContractedSubBlock.gif        
while (matcher.find()) dot.gif{
InBlock.gif            Vector
<String> v = new Vector<String>();
InBlock.gif            
for(int i=1;i <= matcher.groupCount();i++)
ExpandedSubBlockStart.gifContractedSubBlock.gif            
dot.gif{
InBlock.gif
InBlock.gif                v.add(matcher.group(i));
ExpandedSubBlockEnd.gif            }

InBlock.gif            colInoput.add(v);
ExpandedSubBlockEnd.gif        }
  
InBlock.gif        String[][] resultList 
=null;
InBlock.gif        
if(colInoput.size()>0)     
InBlock.gif           resultList
=new String[colInoput.size()][colInoput.get(0).size()];
InBlock.gif        
for(int i=0;i< colInoput.size();i++)
ExpandedSubBlockStart.gifContractedSubBlock.gif        
dot.gif{
InBlock.gif            String[] kk 
= new String[colInoput.get(i).size()];
InBlock.gif            colInoput.get(i).copyInto(kk);
InBlock.gif            resultList[i] 
= kk;
ExpandedSubBlockEnd.gif        }

InBlock.gif        
return resultList;
ExpandedBlockEnd.gif    }
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值