最近学习scala,个人感觉学习最好的方式就是多做例子,今天这里只使用scala获取网页源码(这里纯属于学习,生产中不会用这样的方式),并使用最最简单的正则匹配,主要是知道这个意思,以下是代码:
package com.mhc
import scala.collection.mutable
import scala.io.Source
/**
* Created by Administrator on 2016/5/9.
*/
object Main {
def main(args: Array[String]) {
val queue = new mutable.Queue[String]()
var depth = 0
queue.enqueue("http://www.baidu.com/")
while (queue.size > 0) {
// 把队列中首个元素弹出
val urlStr = queue.dequeue()
val result = Source.fromURL(urlStr)
val lines = result.getLines()
val regex = """<title>(.*?)</title>""".r
var string = ""
for (s <- lines) {
string += s
string += "\r\n"
}
// 打印查看结果
// println(string)
val finalArray = regex.findAllIn(string)
for (m <- finalArray)
println(m)
}
}
}