Buscar clústeres de puntos

La herramienta Buscar clústeres de puntos encuentra clústeres de entidades de punto dentro del ruido colindante en función de su distribución espacial o espaciotemporal.

Por ejemplo, una organización no gubernamental está estudiando una enfermedad concreta propagada por las plagas. Tiene un dataset de puntos que representa a los hogares de su área de estudio, algunos de ellos infestados y otros no. Mediante la herramienta Buscar clústeres de puntos, un analista puede determinar qué clústeres de hogares están infestados para ayudarle a delimitar un área en la que iniciar el tratamiento y la erradicación de las plagas.

Elegir la capa cuyos clústeres se buscarán

La capa de puntos en la que se buscarán los clústeres. Las capas deben estar en una referencia espacial proyectada o tener una referencia espacial de procesamiento definida en un sistema de coordenadas proyectadas mediante Entornos de análisis.

Además de elegir una capa en el mapa, puede elegir Elegir capa de análisis en la parte inferior de la lista desplegable para examinar el contenido del dataset o la capa de entidades de un recurso compartido de archivos de big data. Si lo desea, puede aplicar un filtro en la capa de entrada o aplicar una selección en capas alojadas que haya agregado al mapa. Los filtros y las selecciones solo se aplican al análisis.

Elegir el método de clúster a utilizar

El método de clustering que se utilizará para distinguir clústeres de entidades de puntos de entre el ruido colindante. Puede optar por utilizar una distancia definida o un algoritmo de clustering de autoajuste.

Distancia definida (DBSCAN) utiliza un rango de búsqueda especificado para separar los clústeres densos del ruido más disperso. Opcionalmente, se puede utilizar el tiempo para buscar clústeres espaciotemporales con el rango y la duración de búsqueda. Distancia definida (DBSCAN) es más rápido, pero solo es apropiado si se puede utilizar un rango de búsqueda muy claro y que funcione bien para definir todos los clústeres que puedan estar presentes. Distancia definida (DBSCAN) encuentra clústeres que presentan densidades similares.

El autoajuste (HDBSCAN) no exige que se especifique un rango de búsqueda, pero es un método que lleva más tiempo. El autoajuste (HDBSCAN) busca clústeres de puntos similares a la distancia definida (DBSCAN), pero utiliza rangos de búsqueda variables teniendo en cuenta los clústeres con densidades variables.

Número mínimo de puntos para alimentar un clúster

Este parámetro se utiliza de manera diferente en función del método de clustering elegido de entre las siguientes opciones:

Distancia definida (DBSCAN): especifica el número de entidades que se deben encontrar dentro de una distancia determinada o de una distancia y duración de un punto para que este pueda empezar a formar un clúster. La distancia se define con el parámetro Limitar el rango de búsqueda a. Si se utiliza el tiempo para encontrar clústeres espaciotemporales, la duración se especifica con el parámetro Limitar la duración de búsqueda a.
Autoajuste (HDBSCAN): especifica el número de entidades vecinas de cada punto (incluido el propio punto) que se tendrán en cuenta a la hora de estimar la densidad. Este número es además el tamaño de clúster mínimo permitido al extraer los clústeres.

Limitar el rango de búsqueda a

Si utiliza Distancia definida (DBSCAN), este parámetro es la distancia dentro de la cual se debe encontrar el Número mínimo de puntos para alimentar un clúster. Si la capa de entrada tiene la función de tiempo habilitada y es del tipo Instante, puede seleccionar Utilizar hora para buscar clústeres para encontrar grupos espaciotemporales de puntos en el ruido colindante. Al utilizar el tiempo, el parámetro Limitar la duración de búsqueda a especifica la duración del tiempo dentro del cual se debe encontrar el Número mínimo de puntos para alimentar un clúster, además de estar dentro del rango de búsqueda. Estos parámetros no se utilizan si se eligen Autoajuste (HDBSCAN) como método de clustering.

Nombre de capa de resultados

El nombre de la capa que se creará. Si escribe en un ArcGIS Data Store, sus resultados se guardarán en Mi contenido y se agregarán al mapa. Si escribe en un recurso compartido de archivos de big data, sus resultados se almacenarán en el recurso compartido de archivos de big data y se agregarán a su manifiesto. No se agregarán al mapa. El nombre predeterminado se basa en el nombre de la herramienta y en el nombre de la capa de entrada. Si la capa ya existe, la herramienta fallará.

Cuando escriba en ArcGIS Data Store (big data store espaciotemporal o relacional) con el cuadro desplegable Guardar el resultado en, puede especificar el nombre de una carpeta de Mi contenido en la que se guardará el resultado.