Stream数据流
JDK1.8时已经进入大数据的时代,所以在类集中也支持有数据的流式分析处理操作,为此提供了一个Stream的接口,同时在Collection接口中也提供有接口实例化的方法
- 获取Stream接口对象:default Stream stream()
1、Stream基本操作
Stream主要功能是进行数据的分析处理,同时主要是针对于集合中的数据进行分析操作
Stream的基本操作
public class JavaDemo {
public static void main(String[] args) throws Exception {
List<String> list = new ArrayList<>();
Collections.addAll(list , "Java" , "JavaScript","Python");
Stream<String> stream = list.stream(); //获取Stream接口对象
//System.out.println(stream.count()); //输出元素个数
//将每个元素变为小写字母,并判断j是否存在
System.out.println(stream.filter((ele) -> ele.toLowerCase().contains("j")).count());
}
}
上面的程序只是实现了最基础的个数统计,更多情况下可能是获取里面满足条件的数据内容。
实现数据的采集操作
public class JavaDemo {
public static void main(String[] args) throws Exception {
List<String> list = new ArrayList<>();
Collections.addAll(list , "Java" , "JavaScript","Python");
Stream<String> stream = list.stream(); //获取Stream接口对象
//System.out.println(stream.count()); //输出元素个数
//将每个元素变为小写字母,,将满足j存在条件的数据收集起来转为List集合
List<String> result = stream.filter((ele) -> ele.toLowerCase().contains("j")).collect(Collectors.toList());
System.out.println(result);
}
}
//[Java, JavaScript]
在Stream数据流处理的过程中还允许进行数据的分页处理,提供有两个方法:
- 设置取出最大数据量:Stream limit(long maxSize)
- 跳过指定数据量:Stream skip(long n)
观察分页
public class JavaDemo {
public static void main(String[] args) throws Exception {
List<String> list = new ArrayList<>();
Collections.addAll(list , "Java" , "JavaScript" , "Python" , "JSP" , "Json");
Stream<String> stream = list.stream(); //获取Stream接口对象
//System.out.println(stream.count()); //输出元素个数
//将每个元素变为小写字母,,将满足j存在条件的数据收集起来转为List集合
List<String> result = stream.filter((ele) -> ele.toLowerCase().contains("j")).skip(2).limit(2).collect(Collectors.toList());
System.out.println(result);
}
}
//[JSP, Json]
Stream的操作主要是利用自身的特点实现数据的分析处理操作
2、MapReduce基础模型
在进行数据分析的处理之中有一个最重要的基础模型:MapReduce模型,一共分为两个部分,Map处理部分和Reduce分析部分
在进行数据分析之前要对数据进行合理的处理,然后才可以统计分析操作
MapReduce基础模型
public class JavaDemo {
public static void main(String[] args) throws Exception {
//要使用Steam进行分析处理,则一定要将全部要分析的数据保存在集合中
ArrayList<Order> list = new ArrayList<>();
list.add(new Order("小黄鸭" , 9.9 , 10));
list.add(new Order("电脑" , 8999.9 , 2));
list.add(new Order("鼠标" , 99.9 , 5));
list.add(new Order("键盘" , 299.9 , 16));
list.add(new Order("耳机" , 200.9 , 50));
//分析购买商品中含有“小”的信息数据,并且进行商品单价和数量的处理,然后分析汇总
DoubleSummaryStatistics stat = list.stream().filter((ele) -> ele.getName().contains("小"))
.mapToDouble((orderObject) -> orderObject.getPrice() * orderObject.getAmount())
.summaryStatistics();
System.out.println("购买数量:" + stat.getCount());
System.out.println("购买总价:" + stat.getSum());
System.out.println("平均花费:" + stat.getAverage());
System.out.println("最高花费:" + stat.getMax());
System.out.println("最低花费:" + stat.getMin());
}
}
class Order{ //订单信息
private String name; //商品名称
private double price; //商品单价
private int amount; //商品数量
public Order(String name, double price, int amount) {
this.name = name;
this.price = price;
this.amount = amount;
}
public String getName() {
return name;
}
public double getPrice() {
return price;
}
public int getAmount() {
return amount;
}
}
这些分析操作只是JDK本身提供的支持,在实际开发中,肯定不会这样进行,因为所有的数据如果都保存在内存中,面对大数据的环境,会直接崩坏掉