Пошук кластерів точок

Пошук кластерів точок


Інструмент Пошук кластерів точок виконує пошук кластерів точкових об’єктів у межах навколишнього шуму на основі їх просторового або просторово-часового розподілу.

Наприклад, неурядова організація досліджує певне захворювання, яке переноситься шкідниками. У неї є набір точкових даних, який представляє домогосподарства в області, що вивчається, деякі із яких заражені. Використовуючи інструмент Пошук кластерів точок, дослідник може визначити кластери заражених домогосподарств, щоб більш точно виявити область, з якої потрібно почати обробку і винищення шкідників.

Вибрати шар, для якого будуть знаходитися кластери


Шар точок, де буде здійснюватися пошук кластерів. Шари повинні бути у просторовій прив’язці проекції або мати просторову прив’язку процесу, призначену системі координат проекції за допомогою Середовище аналізу.

Можна не тільки обирати шар на карті, а й обрати Вибрати шар аналізу внизу розкривного списку для огляду ваших ресурсів, які містяться у наборі даних спільного файлового сховища великих даних або у векторному шарі. Ви можете додатково застосувати фільтр на вашому вхідному шарі або застосувати вибір на розміщених на хості шарах, доданих до вашої карти. Фільтри та вибори застосовуються тільки для аналізу.

Виберіть метод кластеризації для використання


Метод кластеризації для розрізнення кластерів точкових об’єктів від навколишнього шуму. Можна використовувати метод «Указана відстань» або алгоритм кластеризації «Автонастройка».

Метод «Указана відстань» (DBSCAN) використовує заданий діапазон пошуку для відділення щільних кластерів від менш щільного шуму. Як варіант, для пошуку просторово-часових кластерів за допомогою діапазону і тривалості пошуку можна використовувати час. Метод «Указана відстань» (DBSCAN) є найшвидшим, але може застосовуватися лише якщо чітко ясно, який діапазон пошуку використовувати для отримання гарних результатів для всіх потенційних кластерів. Метод «Указана відстань» (DBSCAN) відшукує кластери зі схожими щільностями.

«Автонастройка» (HDBSCAN) не потребує задання діапазону пошуку, але цей метод витрачає більше часу. «Автонастройка» (HDBSCAN) відшукує кластери точок аналогічно методу «Указана відстань» (DBSCAN), але використовує перемінні діапазони пошуку, що дозволяє відділяти кластери з різними щільностями.

Мінімальне число точок для створення кластеру


Цей параметр використовується по-різному в залежності від обраного із наведених нижче варіантів методу кластеризації:

  • Указана відстань (DBSCAN) — задає кількість об’єктів, які потрібно знайти в межах певної відстані або відстані і тривалості точки для того, щоб ця точка почала утворювати кластер. Відстань визначається за допомогою параметру Обмежити діапазон пошуку до. Якщо для виявлення просторово-часових кластерів використовується час, тривалість задається за допомогою параметра Обмежити тривалість пошуку до.
  • Автонастройка (HDBSCAN) — задає кількість об’єктів, що є сусідами кожної точки (включаючи саму точку), які будуть враховуватися при оцінці щільності. Це число також є мінімальним дозволеним розміром кластера при виділенні кластерів.

Обмежити діапазон пошуку до


Коли використовується метод указаної відстані (DBSCAN), цей параметр являє собою відстань, в межах якої повинно бути знайдено Мінімальне число точок для створення кластеру. Якщо у вхідному шарі активований час і він належить до типу «поточний момент», можна обрати Використовувати час для пошуку кластерів для виявлення просторово-часових груп точок в оточуючому шумі. Якщо використовується час, параметр Обмежити тривалість пошуку до задає відрізок часу, в межах якого повинна бути величина Мінімальне число точок для створення кластеру, яка, крім того, повинна перебувати в межах пошукового діапазону. Ці параметри не використовуються, якщо в якості метода кластеризації вибрано автонастройку (HDBSCAN).

Назва результуючого шару


Назва шару, який буде створено. Якщо ви записуєте результати у ArcGIS Data Store, вони будуть зберігатися у Мої ресурси і додаватися до карти. Якщо ви записуєте результати у спільне файлове сховище великих даних, вони будуть зберігатися у спільному файловому сховищі великих даних і додаватися до його маніфесту. Він не буде додаватися до карти. Назва за замовчуванням базується на назві інструменту та назві вхідного шару. Якщо шар уже існує, інструмент не буде працювати.

При записі до ArcGIS Data Store (реляційного або просторово-часового сховища великих даних) з використанням розкривного меню Зберегти результати в, можна указати ім’я папки у Мої ресурси, в яку будуть збережені результати.