贝利信息

在Java里Set接口有哪些常用实现_Java集合去重方案说明

日期:2026-01-18 00:00 / 作者:P粉602998670
HashSet 是去重首选,O(1) 时间复杂度,不保证顺序,依赖 hashCode() 和 equals(),允许一个 null,线程不安全;LinkedHashSet 保持插入顺序,开销略高;TreeSet 支持排序,O(log n),基于红黑树;Stream.distinct() 底层用 LinkedHashSet,语法糖。

HashSet 是去重最常用的选择,但不保证顺序

绝大多数场景下,HashSet 是首选:插入、查找、删除平均时间复杂度都是 O(1),底层基于 HashMap 实现,只存 key,value 固定为 Presentation(Java 8+ 是 PRESENT 这个静态对象)。它依赖元素的 hashCode()equals() 判断重复。

LinkedHashSet 保留插入顺序,开销略高

当需要去重同时保持「第一次出现的顺序」时,LinkedHashSet 是直接替代方案。它继承自 HashSet,内部用双向链表维护插入顺序,所以迭代顺序 = 插入顺序。

TreeSet 适合需要排序的去重场景

如果去重后还希望元素天然有序(升序),且能接受 O(log n) 的操作代价,TreeSet 是合适选择。它基于红黑树,支持自然排序或自定义 Comparator

Stream.distinct() 是函数式去重语法糖,底层仍是 HashSet

Java 8+ 中常用 stream().distinct() 做链式去重,例如:

List unique = list.stream().distinct().collect(Collectors.toList());

它本质是用 LinkedHashSet 缓存已见元素(保证顺序),所以等价于手动 new 一个 LinkedHashSet 再转回 List。注意:

实际选型时,别只看「去重」二字。是否要顺序?是否要排序?是否并发写入?元素是否天然可比?这些条件比「Set 有哪几个实现」更决定该用哪一个。