Что делает distinct в Stream API?

Question

claude-haiku-4.5 · Accepted Answer

# Что делает distinct в Stream API Метод `distinct()` — это промежуточная операция в Stream API, которая удаляет дубликаты из потока. ## 1. Базовый пример ```java List numbers = Arrays.asList(1, 2, 2, 3, 3, 3, 4, 5, 5); List unique = numbers.stream() .distinct() .collect(Collectors.toList()); System.out.println(unique); // [1, 2, 3, 4, 5] ``` ## 2. Как работает distinct() `distinct()` использует метод `equals()` и `hashCode()` для определения, являются ли элементы одинаковыми: ```java List fruits = Arrays.asList("apple", "banana", "apple", "cherry", "banana"); List unique = fruits.stream() .distinct() // Использует String.equals() .collect(Collectors.toList()); System.out.println(unique); // [apple, banana, cherry] ``` ## 3. С объектами Для пользовательских объектов нужно переопределить `equals()` и `hashCode()`: ```java public class Person { private String name; private int age; @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Person person = (Person) o; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); } } List people = Arrays.asList( new Person("John", 25), new Person("Jane", 30), new Person("John", 25), // Дубликат new Person("Bob", 25) ); List unique = people.stream() .distinct() // Будет сравнивать через equals() и hashCode() .collect(Collectors.toList()); System.out.println(unique.size()); // 3 (John 25 появится только один раз) ``` ## 4. Внутренняя реализация `distinct()` использует `HashSet` для отслеживания уже увиденных элементов: ```java // Примерно так работает distinct() внутри public static Stream distinct(Stream stream) { Set seen = new HashSet<>(); return stream.filter(elem -> seen.add(elem)); // Set.add() возвращает true только если элемента не было в наборе } ``` ## 5. Производительность `distinct()` имеет линейную сложность O(n), но требует дополнительную память O(n): ```java List million = new ArrayList<>(); for (int i = 0; i < 1_000_000; i++) { million.add(i % 1000); // Повторяются значения от 0 до 999 } long start = System.currentTimeMillis(); List unique = million.stream() .distinct() // Создаст HashSet с 1000 элементами .collect(Collectors.toList()); long duration = System.currentTimeMillis() - start; System.out.println("Size: " + unique.size()); // 1000 System.out.println("Time: " + duration + "ms"); ``` ## 6. distinct() с другими операциями ```java // С map() — получить уникальные имена List names = people.stream() .map(Person::getName) .distinct() .collect(Collectors.toList()); // С filter() — сначала фильтруем, потом уникализируем List adults = people.stream() .filter(p -> p.getAge() >= 18) .distinct() .collect(Collectors.toList()); // С sorted() — отсортировать уникальные элементы List sortedUnique = numbers.stream() .distinct() .sorted() .collect(Collectors.toList()); ``` ## 7. distinct() с пользовательским компаратором Если нужна уникализация по определённому полю (не через equals()): ```java public static Stream distinctBy(Stream stream, Function keyExtractor) { Set

Что делает distinct в Stream API?

Комментарии (1)

1. Базовый пример

2. Как работает distinct()

3. С объектами

4. Внутренняя реализация

5. Производительность

6. distinct() с другими операциями

7. distinct() с пользовательским компаратором

8. Альтернатива через LinkedHashSet

9. Частые ошибки

Ошибка 1: Забыли переопределить equals() и hashCode()

Ошибка 2: Используют с параллельными потоками неправильно

10. distinct() в SQL vs Stream API

11. Практический пример: Уникальные статьи по тегам

12. Производительность: Stream vs Set

Вывод