Atrast punktu klasterus

Atrast punktu klasterus


Rīks Atrast punktu klasterus uz apkārtējā trokšņa fona atrod punktu elementu klasterus, ņemot vērā to telpisko vai laika un telpas sadalījumu.

Piemēram, nevalstiskā organizācija pēta konkrētu kaitēkļu izraisītu slimību. Tās rīcībā ir punktu datu kopa, kas apzīmē mājsaimniecības pētāmajā teritorijā, un daži no šiem punktiem ir invadēti, bet daži nav. Izmantojot rīku Atrast punktu klasterus, analītiķis var noteikt inficēto mājsaimniecību datu klasterus, lai palīdzētu atrast teritoriju, kur sākt ārstēšanu un kaitēkļu iznīcināšanu.

Izvēlēties slāni, kuram tiks atrasti klasteri


Punktu slānis, kurā tiks atrasti klasteri. Slāņiem ir jābūt ar projicēto telpisko atskaiti, vai arī apstrādes telpiskā atskaite ir jāiestata uz projicēto koordinātu sistēmu, izmantojot Analīzes darba vides.

Papildus slāņa izvēlei kartē varat izvēlēties opciju Izvēlēties analīzes slāni nolaižamā saraksta lejasdaļā, lai saturā atrastu Big Data koplietojuma datu kopu vai elementu slāni. Jūs varat arī papildus lietot filtru savam ievades slānim vai izmantot savai kartei pievienoto viesoto slāņu atlasi. Filtri un atlase tiek lietota tikai analīzei.

Izvēlieties izmantojam klasteru veidošanas metodi


Klasteru veidošanas metode, kas tiks izmantota, lai atšķirtu punkta elementu kopas no apkārtējiem traucējumiem. Varat izvēlēties izmantot noteiktu attālumu vai pašregulējošu klasterēšanas algoritmu.

Definētais attālums (DBSCAN) izmanto norādīto meklēšanas diapazonu, lai atdalītu blīvus klasterus no vāja trokšņa. Citā variantā laiku var izmantot, lai atrastu telpas un laika klasterus, izmantojot gan meklēšanas diapazonu, gan meklēšanas ilgumu. Definētais attālums (DBSCAN) ir ātrāks, bet ir piemērots tikai tad, ja ir ļoti skaidrs meklēšanas diapazons, kas labi darbojas, definējot visas kopas, kas var būt pieejamas. Definētais attālums (DBSCAN) atrod klasterus ar līdzīgu blīvumu.

Pašregulācijai (HDBSCAN) nav jānorāda meklēšanas diapazons, bet tā ir daudz laikietilpīgāka metode. Pašregulējoši (HDBSCAN) atrod punktu kopas, kas ir līdzīgas noteiktajam attālumam (DBSCAN), bet izmanto dažādus meklēšanas diapazonus, kas ļauj veidot kopas ar dažādu blīvumu.

Minimālais punktu skaits, lai aizpildītu klasteri


Šis parametrs tiek izmantots atšķirīgi atkarībā no izvēlētās klasterēšanas metodes starp šādām:

  • Definētais attālums (DBSCAN) — norāda elementu skaitu, kas jāatrod noteiktā attālumā vai attālumā un ilgumā no punkta, lai šis punkts sāktu veidot klasteri. Attālums tiek definēts, izmantojot parametru Ierobežot meklēšanas diapazonu. Ja telpas un laika klasteru atklāšanai izmanto laiku, ilgumu norāda, izmantojot parametru Ierobežojiet meklēšanas ilgumu līdz.
  • Pašregulējoša (HDBSCAN) – norāda to iezīmju skaitu, kas atrodas blakus katram punktam (ieskaitot pašu punktu) un ko ņem vērā, novērtējot blīvumu. Šis skaitlis ir arī minimālais klastera lielums, kas pieļaujams, izgūstot klasterus.

Ierobežojiet meklēšanas diapazonu līdz


Izmantojot noteiktu attālumu (DBSCAN), šis parametrs ir attālums, kurā jāatrod minimālais punktu skaits, ko uzskata par kopu. Ja ievades slānis ir pamatots ar laiku un tas ir tūlītējs, jūs varat atlasīt Izmantot laiku klasteru atrašanai, lai apkārtējā troksnī atrastu telpas un laika punktu grupas. Izmantojot laiku, parametrs Ierobežot meklēšanas ilgumu līdz norāda laika ilgumu, kurā jāatrod minimālais punktu skaits, ko uzskata par klasteri, un tiem ir jāatrodas meklēšanas diapazonā. Šie parametri netiek izmantoti, ja kā izmantojamā klasterēšanas metode tiek izvēlēta pašregulācija (HDBSCAN).

Rezultātu slāņa nosaukums


Izveidojamā slāņa nosaukums. Ja ierakstāt ArcGIS Data Store, rezultāti tiks saglabāti mapē Mans saturs un pievienoti kartei. Ja rakstāt Big Data faila koplietojumā, rezultāti tiks saglabāti Big Data failu koplietojumā un pievienoti tā sarakstam. Tas netiks pievienots kartei. Noklusējuma nosaukums ir balstīts uz rīka nosaukumu un ievades slāņa nosaukumu. Ja slānis jau pastāv, rīks nedarbosies.

Rakstot uz ArcGIS Data Store (relāciju vai telpas un laika Big Data krātuvi), izmantojot nolaižamo lodziņu Saglabāt rezultātu, var norādīt mapes nosaukumu mapē Mans saturs, kurā tiks saglabāts rezultāts.