之前我发了一篇用python造数据的代码,现在用scala造数据(毕竟学习大数据不能不用scala)
添加了命令行输入行数,增加了IP字段
注意,里边的IP, URL都是之前定义的数据,可以自己写,也可以直接上网找IP库,为了调整方便做成的外部数据源输入
import java.io.{File, PrintWriter}
import scala.collection.mutable.ArrayBuffer
import scala.io.Source
object MkLogScala {
//读取IP
def ReadIP():String = {
//定义IP列表
var ip: List[String] = List()
// 读取IP文件
val fd = Source.fromFile("F:/TEST_DATA/ip.txt")
// 将文件内容分割
for (line <- fd.getLines()) {
//行输入时进行分割成列表
val lines = line.split("\t")
ip = List.concat(ip, lines)
}
//# 随机读取一个url
val ip1 = ip((new util.Random).nextInt(ip.size))
//# 关闭url文件
fd.close()
//返回url
return ip1
}
// 随机读取url
def ReadUrl() : String = {
//定义url列表
var url: List[String] = List()
// 读取url文件
val fd = Source.fromFile("F:/TEST_DATA/url.txt")