Por Anahí Aguilera y Francisco Bautista

Introducción

La Geoestadística se compone de la palabra Geos= tierra y estadística (del italiano statista, hombre de Estado) es una ciencia formal deductiva para recolectar y analizar datos para luego establecer conclusiones relevantes o comprender los hechos. La Geoestadística puede considerarse como una disciplina que se ocupa del análisis estadístico de variables espacialmente distribuidas

La necesidad de estimar los valores de una variable en sitios no muestreados dio paso al desarrollo de métodos y herramientas que permiten estudiar fenómenos con correlación espacial. La geoestadística tiene aplicaciones múltiples, entre las que destacan las mineras, edáficas y ambientales.

La palabra kriging procede del nombre del geológo D. G. Krige, cuyos trabajos en la predicción de reservas de oro se consideran pioneros en los métodos de interpolación espacial. La relevancia del kriging (método de interpolación espacial) se centra en la minimización del error cuadrático medio de predicción, dando una medida de certeza o precisión de la predicción. Se basa en la primera ley de la geografía. “Todas las cosas están relacionadas entre sí, pero las cosas más próximas en el espacio tienen una relación mayor que las distantes”.

Los pasos para realizar un análisis geoestadístico son los siguientes: a) Muestro sistemático o “lo más parecido”, generación de datos y elaboración de “Bases de datos georeferenciadas”; b) Análisis exploratorio de datos. Eliminación de datos erróneos, pruebas de distribución gaussiana o de normalidad; c) Análisis estructural. Correlación  de la variable, cálculo del variograma experimental y  ajuste del variograma teórico (Autocorrelación); d) Interpolación. Estimaciones de la variable en los puntos no muestrales; y e) Elaboración del mapa.

1.      Muestreo sistemático

Cuando se pretende hacer un análisis geoestadístico o espacial se requiere tratar de cubrir “Toda” o la mayor superficie posible, porlo que se requiere un conjunto de datos georeferenciados, es decir con sus coordenadas que nos lleven al sitio de muestreo. En suelos se recomienda un número de sitios de muestreo alrededor 100 (Webster y Oliver), aunque se han publicado artículos científicos con bases de datos con 30 sitios (Delgado et al., 2017).

2.      Análisis exploratorio de los datos

El análisis geoestadístico comienza con la revisión estadística de los datos. Uno de los requisitos de la interpolación con kriging es la distribución Gaussiana o “Normal” del conjunto de datos, por tanto, es importante prestar atención a la presencia de valores extremos. En caso de tener una distribución de frecuencias asimétrica, se puede realizar una transformación logarítmica o por raíz cuadrada de los datos. Si se aplica alguno de estos procesos, es importante realizar una transformación inversa para obtener los resultados en las mismas unidades de la variable analizada.

Si la transformación del conjunto de datos no da resultado se recomienda usar otro tipo de técnica de interpolación.

3.      Análisis de la semivarianza

De lo que se trata es de que el conjunto de datos propios que llamaremos experimental, con los que queremos hacer el análisis, los debemos “ajustar” a unos modelos teóricos, tales como efecto pepita puro, esférico, exponencial, gaussiano, entre otros. Ese ajuste se realiza mediante el semivariograma (Figura 1).

Para la estimación de kriging, se requiere construir el semivariograma experimental para cuantificar la autocorrelación o estructura espacial de una variable . La forma de estimación más común del semivariograma está dada por:

Ecuación 1. Donde h es la distancia entre dos sitios,  N (h) es el número de pares para (xi) y (xi+ h) .

El semivariograma teórico es el modelo más adecuado para la interpolación de los datos y proporciona mayor solidez a la interpolación pues permite explicar la correlación espacial existente entre los sitios muestreados (Sánchez-Duque et al. 2015).

Fig. 1 Ejemplo de un semivariograma experimental ajustado a un modelo teórico. El rango indica la distancia hasta la cual existe autorrelación espcial. La meseta (sill) indica el punto de inflexión del semivariograma. El nugget representa el error o ruido de fondo.

Algunos parámetros que pueden ser especificados en el programa GS+ son el “active lag ditance” y el número de “lag intervals”.

“Active lag distance”: especifica el intervalo sobre el cual se calculará la semivarianza. El indicado por defecto es un porcentaje de la distancia máxima entre sus datos, no significa que sea el más apropiado para sus datos, pero provee un punto de partida para comenzar la exploración.

“Lag intevals”: el “active lag distance” es dividido en varios intervalos para el análisis. Durante el análisis de la semivarianza el número de intervalos cambiará “active lag”.

Una vez obtenido el semivariograma experimental, es importante probar los modelos teóricos que ofrece el programa, revisar el nugget, la meseta y el rango. Respecto a este último, es importante revisar que el rango sea mayor que la distancia entre puntos de muestreo, de otra manera no existirá interpolación entre los puntos de muestreo, ya que el rango indica la distancia hasta la cual existe autocorrelación espacial.

También es importante revisar el ajuste del modelo, esto ayuda a elegir el mejor modelo para el semivariograma experimental. El error residual (“Residual SS”) debe ser el menor posible, mientras que el r” y la proporción explicada por el modelo deben ser las mayores posibles.

Los pares de puntos que forman el semivariograma hasta la meseta deben ser cinco o más, para asegurar una adecuada autocorrelación espacial.

Las causas más comunes de semivariogramas deficientes son: a) el valor idóneo del incremento h; b) distribuciones con valores extremos; c) la existencia de poblaciones mixtas, dos o más. Otras son: No hay suficientes muestras o hay muchas muestras con varias poblaciones; las muestras no son representativas del fenómeno; las clasificaciones de las muestras no son válidas; el área estudiada es no homogénea; las muestras pueden tener localizaciones incorrectas; y los valores muestreados pueden ser erróneos.

4.      Interpolación espacial

Basado en la estructura espacial , el estimador de kriging  para la variable en un sitio no muestreado se define como: z* (x’ ) = ∑_λi z(xi)〗

Utilizando el estimador de kriging se construye la interpolación en el programa GS+.

Es recomendable utilizar un número considerable de intervalos para la interpolación, cinco clases es un número aconsejable, para facilitar la visualización e interpretación de los resultados.

Posteriormente, para evaluar el ajuste del modelo, se utiliza el método de validación cruzada, que consiste en excluir la observación de uno de los puntos de muestreo y predecir su valor utilizando los valores restantes y el modelo elegido (Giraldo Henao, 2011). Si bien existen diferentes métodos para evaluar el ajuste del modelo elegido, la validación cruzada es uno de los más utilizados.

Es recomendable guardar todos los datos del análisis espacial, una captura de pantalla como la siguiente puede ser suficiente. El semivariograma y la interpolación ideal de los datos se obtienen a través de las pruebas.

5.      Elaboración del mapa

Se recomienda que el análisis geoestadístico se realice con un software especializado porque existe algunos softwares que no lo son, en estos el análisis geoestadístico es una “una caja negra”. Nosotros recomendamos el software GS+ para el análisis geoestadístico para luego confeccionar el mapa en un sistema de información geográfica.

Referencias

Giraldo Henao, R., 2011. Introducción a la geoestadistica. Teoría y aplicación. Universidad Nacional de Colombia, Bogotá. https://doi.org/10.1007/s10113-014-0627-7

Guillén, M.T., Delgado, J., Albanese, S., Nieto, J.M., Lima, A., De Vivo, B., 2011. Environmental geochemical mapping of Huelva municipality soils (SW Spain) as a tool to determine background and baseline values. J. Geochemical Explor. 109, 59–69. https://doi.org/10.1016/j.gexplo.2011.03.003

Guvenç, N., Alagha, O., Tuncel, G., 2003. Investigation of soil multi-element composition in Antalya, Turkey. Environ. Int. 29, 631–640. https://doi.org/10.1016/S0160-4120(03)00046-1

Delgado, C., Bautista, F., Ihl, T., Palma-López, D. 2017. Evaluación de la aptitud de tierras para la agricultura de temporal usando la duración del periodo de lluvia en el estado de Yucatán. Ecosistemas y Recursos Agropecuarios, 4(12):485-497.

Abrir chat