#读取网页
url <- 'http://vip.stock.finance.sina.com.cn/q/go.php/vInvestConsult/kind/qgqp/index.phtml?qq-pf-to=pcqq.c2c&p=1'
#url <- './web.html'
web <- readLines(url)
#初步筛选模式
pt1 <- '<table.*>'
pt2 <- '</table>'
#查找需要的信息
web <- web[grep(pt1, web):grep(pt2, web)]
#信息筛选模式
pt <- '<[^>]*?>'
#进一步清洗处理
cont <- gsub(pt, '', web)
cont <- gsub('\\s+', '', cont)
cont <- cont[cont!='']
#数据展现
mtr <- matrix(cont, ncol = 12, byrow = TRUE)
#写入文件
write.csv(mtr, './res.csv')