java 8 聚合操作详解-亚博电竞手机版
oracle在2014年3月19日如期发布了java 8。java 8版本被认为是具有里程碑意义的一个版本,oracle在该版本中添加了许多新特性,包括lambda表达式、方法引用、加强了安全等等。
在众多的新特性中,聚合操作(aggregate operations)是针对集合类的一个比较大的变化。通过聚合操作,开发者可以更容易地使用lambda表达式,并且更方便地实现对集合的查找、遍历、过滤以及常见计算等。
聚合操作与java 8中的lambda表达式、方法引用等新特性是相关的,一般一起组合使用,但这里只说明聚合操作的使用,下面就聚合操作的使用进行简单说明。
集合类的层次结构
集合类是java语言提供的辅助类,是一种较为通用的数据结构,如map、set、list等。java中集合类层次关系如下:
图 1
如上图,collection是主要集合类的接口,其子接口(具化接口)有deque、queue、set、list等。
map是另一种类型的集合,以key、value的键值对存储数据集。
在java 8中,在java.util.collection接口中添加了如下方法:
streamstream() { return streamsupport.stream(spliterator(), false); }
stream()方法的可见性修饰符为default,这又是java 8的新特性。在接口中(collection为interface),本不需要(也不能)进行方法实现,但引入default修饰后就不同了。开发者不但可以进行方法的实现,而且还不用考虑向后兼容的问题。关于default method的详细解释,读者可以参考java 8的官方文档。
正是stream方法引出了集合类的聚合操作。
[注意]
map接口中并没有stream()方法,但是map的values()和keyset()均返回集合对象,在集合对象上当然是可以使用stream()方法的。
聚合操作实例
为说明聚合操作的使用,首先定义一个数据元素类person,如下:
import java.time.localdate; public class person { string name; localdate birthday; sex gender; string emailaddress; public int getage() { return localdate.now().getyear() - birthday.getyear(); } public void setbirthday(localdate birthday){ this.birthday = birthday; } public void setgender(sex sex){ this.gender = sex; } public void printperson() { system.out.println("the name is " name); } public sex getgender(){ return gender; } public enum sex { male, female } }
在java 8以前的版本中,对person集合的遍历往往采用以下方式:
setpersons = new hashset ();
//传统遍历方式 for (person person : persons) { if (person.getage() > 18) { system.out.println(person.name ” is elder than 18.”); } }
同样的功能,在java 8中使用聚合操作,可以实现如下:
//使用聚合操作 persons.stream().filter(new predicate() { @override public boolean test(person person) { if (person.getage() > 18) { return true; } else { return false; } } }).foreach(new consumer () { @override public void accept(person person) { system.out.println(person.name " is elder than 18."); } });
首先,在集合对象persons上调用stream()方法(聚合操作),取得person对象的数据集(elements),然后调用聚合操作filter()对集合中的元素进行过滤,再调用foreach()完成对符合条件的person的打印。
predicate和consumer为java 8中定义的函数接口(functional interface),在java.util.function包下面,函数接口也是java 8的新特性。在上述代码中,使用了两个匿名类分别对predicate和consumer进行了实现,这两个接口都只有一个方法,这也是函数接口的特征之一。
上述代码中的写法还是比较繁琐的,为进一步简化,可以使用lambda表达式实现,如下:
// 使用聚合操作及lambda persons.stream() .filter(p -> p.getage() >= 18) .foreach(p -> system.out.println(p.name " is elder than 18."));
因为filter()、foreach()的参数均为函数接口,所以可以替换为lambda表达式的方式。简单来理解,lambda表达式就是允许开发者将代码逻辑作为参数进行传递,关于lambda表达式的详细内容,请参java 8的官方文档。
聚合操作的使用
聚合操作是java 8针对集合类,使编程更为便利的方式,可以与lambda表达式一起使用,达到更加简洁的目的。
前面例子中,对聚合操作的使用可以归结为3个部分:
- 数据源部分:通过stream()方法,取得集合对象的数据集。
- 通过一系列中间(intermediate)方法,对数据集进行过滤、检索等数据集的再次处理。如上例中,使用filter()方法来对数据集进行过滤。
- 通过最终(terminal)方法完成对数据集中元素的处理。如上例中,使用foreach()完成对过滤后元素的打印。
中间方法除了filter()外,还有distinct()、sorted()、map()等等,其一般是对数据集的整理(过滤、排序、匹配、抽取等等),返回值一般也是数据集。
最终方法往往是完成对数据集中数据的处理,如foreach(),还有allmatch()、anymatch()、findany()、findfirst(),数值计算类的方法有sum、max、min、average等等。最终方法也可以是对集合的处理,如reduce()、collect()等等。reduce()方法的处理方式一般是每次都产生新的数据集,而collect()方法是在原数据集的基础上进行更新,过程中不产生新的数据集。
从上面的例子中可以看出,通过stream()方法,从集合对象获取的数据集与集合对象的迭代器(iterator)有些类似,但他们也不完全相同:
- 迭代器提供next()、hasnext()等方法,开发者可以自行控制对元素的处理,以及处理方式,但是只能顺序处理;
- stream()方法返回的数据集无next()等方法,开发者无法控制对元素的迭代,迭代方式是系统内部实现的,同时系统内的迭代也不一定是顺序的,还可以并行,如parallelstream()方法。并行的方式在一些情况下,可以大幅提升处理的效率。
除上述介绍的聚合操作外,java 8中还提供了其他更为丰富的聚合操作,读者可以参考java 8的开发参考,了解更多内容。
总结
java 8提供的聚合操作,以及一起使用的lambda表达式为开发者带来了便利,尤其在面向逻辑易变、开发迭代较快的项目应用时。但笔者个人认为,在带来方便的同时,可能也带来了一些麻烦,如相同逻辑的复用,以及代码的查错、修改等,当然这些问题也是相对而言的。毕竟,任何事物都有两面性,技术在不断的发展,java也在不断地调整自己的适应性,变得功能越来越多,越来越强大了。