Página principal

Análisis Probabilístico de la Intermitencia de las lluvias horarias en Colombia mediante Funciones de Distribución de Colas Pesadas


Descargar 47.72 Kb.
Fecha de conversión18.07.2016
Tamaño47.72 Kb.
Análisis Probabilístico de la Intermitencia de las lluvias horarias en Colombia mediante Funciones de Distribución de Colas Pesadas
Germán Poveda, Oscar J. Mesa, Paula A. Agudelo, Juan F. Álvarez,

Paola A. Arias, Hernán A. Moreno, Luis F. Salazar, Vladimir G. Toro

y Sara C. Vieira

Posgrado en Aprovechamiento de Recursos Hidráulicos,

Universidad Nacional de Colombia, Sede Medellín

Keywords: Diurnal Cycle, Precipitation, Tropical Andes of Colombia, Heavy-tailed Distributions, Stable Distributions, Intermittency.
Abstract

Hourly precipitation exhibits high variability in time, therefore being


highly intermittent, with predominance of no rainfall in the record; at
least 85% for rainfall over Central Colombia. We study the probability
density function (PDF) of the highest quantiles of hourly rainfall
records at 51 raingauges located over the tropical Andes of Colombia.
Overall, the PDF analysis allowed us to determine that rainfall is less
likely to occur during the morning hours (between 07 and 13 hours LST).
High intermittency of hourly rainfall suggested using fat-tail
distributions to describe and adequately represent the tails of the
PDFs. Data show that indeed this is the case. We found two sets of
parameters that adequately describe hourly rainfall records for the 90%
quantiles of the PDF, corresponding to the 07-13 hours and to the
remaining three quarters of the day. These results have important
implications towards understanding variability of rainfall in time, and
its probabilistic representation.

Palabras Claves: Ciclo Diurno, Precipitación, Andes Tropicales de Colombia, Colas Pesadas, Distribuciones Estables, Intermitencia.
Resumen

La precipitación horaria en los Andes tropicales de Colombia es un fenómeno altamente intermitente, con predominancia de ceros (no lluvia) en el registro. Se estudia la función de distribución de probabilidades y, en particular, de los cuantiles superiores de los registros horarios de lluvia en 51 estaciones en los Andes de Colombia. El cálculo de los percentiles muestra que por lo menos el 85% de los datos de cada una de las series, corresponden a valores iguales a cero. En el estudio de las funciones de distribución acumulada es posible establecer que, en general, se presenta una menor probabilidad de ocurrencia de eventos de lluvia entre las 7 y las 13 LST, es decir, en la mañana. Los registros se ajustan bien a funciones de distribución estables de colas pesadas con una clara asimetría hacia la derecha y una alta intermitencia. Estas funciones de distribución permiten representar eventos en los cuales, aunque las probabilidades de los eventos más extremos son pequeñas, alcanzan a tener gran peso en la distribución. Se establecieron dos grupos de parámetros que definen estas funciones para las estaciones estudiadas, uno para las horas del día entre las 13 y las 7 LST, y el segundo para la caracterización de las horas de la mañana, ya que es claro que este período presenta un comportamiento singularmente diferente. Estos resultados tienen importancia en el entendimiento de la variabilidad temporal de las lluvias horarias y en su cuantificación probabilística.



1Introducción


La precipitación horaria en los Andes tropicales de Colombia es un fenómeno altamente intermitente, con predominancia de ceros en el registro. Por esta razón surge el interés de estudiar las probabilidades asociadas a los eventos de precipitación horaria y determinar la importancia de los eventos máximos y la influencia en el comportamiento del ciclo diurno de la gran cantidad de horas en las que no se presentan lluvias.

Las funciones de distribución acumuladas del ciclo diurno de precipitación en esta región de Colombia presentan colas de gran longitud y de pequeña velocidad de convergencia. Por esta razón surge la necesidad de analizar las colas de las distribuciones con el fin de determinar si es posible asociar este comportamiento al que presentan distribuciones de colas pesadas provenientes de una clase más amplia de distribuciones llamadas “estables” (Nolan,1999). Tal tipo de funciones de distribución permiten representar eventos en los cuales, aunque las probabilidades de los eventos más extremos son pequeñas, alcanzan a tener gran peso en la distribución. Los resultados obtenidos en este trabajo pueden generar aplicaciones que es necesario estudiar más a fondo.



2Información y Aspectos Metodológicos

2.1Información


En el estudio propuesto en este trabajo se emplearon 51 estaciones pluviográficas ubicadas en los Andes Tropicales de Colombia, cuya descripción y ubicación geográfica se muestran en el trabajo de Poveda et al., (2002, VI Congreso Colombiano de Meteorología), Agudelo et al. (2001), Álvarez y Toro (2001) y Vieira y Moreno (2001).

2.2Aspectos Metodológicos


La precipitación a escala horaria es un fenómeno altamente intermitente, con predominancia de ceros (no lluvia) en el registro. Como ejemplo, la estación Alban contiene 206651 valores sin precipitación alguna y 25225 valores diferentes de cero. Esta observación impone un análisis detallado de la función de distribución de probabilidades y en particular de los cuantiles superiores. Con el fin de describir las series de precipitación horaria, se estimaron las funciones de distribución acumulada, Fx(x), definida como
(0)

Con el objeto de estudiar las probabilidades asociadas a los eventos de precipitación horaria se hizo una partición del día (24 horas) en intervalos de 6 horas, es decir, 07 a 13, 13 a 19, 19 a 01 y 01 a 07 LST, y para cada uno de estos se obtuvo la función de distribución acumulada. Se pretende entonces identificar las diferencias de las características de la FDP para cada unos de los cuatro cuartos del día. Para ello se construyeron los diagramas de función de distribución acumulada de la precipitación diurna agregada por cuartos de día. Se estimó el percentil en el cual la distribución se separa del eje de las ordenadas, es decir, el valor de la distribución en el cual se comienzan a presentar eventos de lluvia, diferentes de cero milímetros. Es importante anotar que en este análisis no se hace referencia a la intensidad de la lluvia, y sólo se evalúa cantidad de horas en el día o en cada cuarto, en las cuales hay precipitación (registro mayor que 0 mm).

Una vez se ha estudiado el comportamiento de las funciones de distribución acumulada para cada una de las estaciones en los diferentes cuartos del día, es posible observar la gran longitud que tienen las colas de la distribución y la pequeña “velocidad” con las que éstas convergen. Por esta razón se realizó un análisis sobre las colas de las distribuciones con el fin de determinar si es posible asociar este comportamiento al que presentan distribuciones de colas pesadas provenientes de una clase más amplia de distribuciones llamadas “estables” (Nolan,1999). El análisis se realizó para un total de 51 estaciones, por lo que se cuenta con un registro estadísticamente significativo.

A continuación se presenta brevemente la teoría básica de las funciones de distribución de colas pesadas. Sea E[Xh] el momento de orden h de una función f(x) dada como



(0)

Para el caso del estudio de la precipitación, esta integral está definida desde cero, puesto que todos los valores son mayores o iguales a cero. Ahora, la función f(x) se dice que tiene colas pesadas si, para algún valor de h>0, la integral



diverge (0)

Note que si (3) diverge para un valor de h0, lo hace para todos los h>h0.

Debido a la cantidad de ceros que presentan las series, para el análisis sólo se consideraron los datos que se encontraran por encima del percentil del 90%, es decir, el decil superior de los datos de cada uno de los cuartos antes definidos. Esto significa que el estudio se hará a las colas de las colas de las distribuciones. Para la caracterización de las colas de estas sub-series se utilizó un método de parametrización propuesto por Samorodnitsky y Taqqu (1994), en donde la función característica de la distribución está dada por la ecuación

(0)

donde la función sign(x) indica el signo de la variable x.


Cada uno de los parámetros que componen la ecuación (4) representan:

 (0,2] : Índice de estabilidad o exponente característico

 [-1,1] : Parámetro de asimetría

> 0 : Parámetro de escala

R : Parámetro de localización
Cuando , los momentos de orden mayor, incluso igual a 1, de f(x) no existen, por lo que la media y la desviación de la función se asocian a los parámetros de localización y de escala , respectivamente. Se tiene entonces que para la serie estandarizadala función de densidad y la distribución están dadas por las ecuaciones
Cuando

(0)

(0)
Cuando

(0)

(0)
donde

(0)

(0)

(0)

(0)
De esta manera, si el índice de estabilidad de una serie es menor que 2, se puede decir que la cola de la distribución es pesada puesto que el límite definido en (2) diverge para todo . El parámetro de asimetría, por su parte, permite describir una serie como totalmente asimétrica a la izquierda o a la derecha según el valor se acerque a los límites del rango, respectivamente.
Con el fin de determinar los parámetros correspondientes para cada una de los cuartos de todas las series, se utilizó el programa Stable, desarrollado por John P. Nolan (Departamento de Matemáticas y Estadística, American University), el programa se puede obtener en la página de internet http://www.cas.american.edu/~jpnolan/atable.txt y que permite estimar los parámetros a partir del conjunto de datos ajustándolos a la función de distribución, dependiendo de las características de.

Se aplicó la prueba Mann – Whitney para verificar la similitud encontrada entre los valores medios de los parámetros para los distintos cuartos del día. Esta prueba permite verificar si las medias de dos muestras son estadísticamente iguales; es además no paramétrica, por lo que no supone la distribución de probabilidades de las series. La prueba consiste en definir como X y Y las dos series a evaluar, y sean N1 y N2 el número de datos, respectivamente, así N = N1 + N2. Se conforma entonces una muestra (W) que reúna a X y Y (con N datos) y se ordenan los valores de menor a mayor.


(13) (14)
Sea R(x(t)) el número de orden (rango) de la observación x(t) en la serie W, se define el valor crítico Uc como
para N1>10 y N2 >10 (15)
por lo tanto se aceptará que y son iguales si
(16)
con Z distribuida como N(0,1), de lo contrario se rechazará la hipótesis de igualdad de medias.


3Análisis y Discusión de Resultados


El cálculo de los percentiles muestra, en general, que por lo menos el 85% de los datos de cada una de las series, corresponden a valores iguales a cero. Valor del percentil por debajo del cual la distribución acumulada de cada estación presenta valores iguales a cero. Este resultado implica que la precipitación en una hora es un evento poco probable, sin embargo, cuando ésta ocurre lo hace presentando el comportamiento promedio descrito en Poveda et al., (2002, VI Congreso Colombiano de Meteorología). Ver detalles en Agudelo et al. (2001), Álvarez y Toro (2001) y Vieira y Moreno (2001).
En la Figura 1 se puede observar la función de distribución acumulada para cada cuarto del día en algunas de las estaciones y a su vez su ubicación espacial. En el 82% de las estaciones (42 de las 51 analizadas) el cuarto de la mañana (07 a 13 horas LST) es cuando se presentan menos eventos de lluvia. Esto se puede observar en las gráficas ya que la línea negra, la cual representa este cuarto, en todos estos casos se despega del eje de las ordenadas por encima del percentil del 85%.
Se concluye que hay una coincidencia entre el cuarto de más alta probabilidad de ocurrencia de eventos de lluvia en cada estación y las horas en las cuales el ciclo diurno presenta sus máximos. En este caso, se observa que a mayor cantidad de eventos mayor intensidad.
El comportamiento descrito para todas las estaciones permite hacer una caracterización importante con respecto a la ubicación de éstas sobre cada una de las cordilleras. En la cordillera occidental vertiente occidental se presenta una mayor probabilidad de ocurrencia de eventos de lluvia en las horas de la tarde (entre 1 PM y 7 PM). Por su parte en las estaciones ubicadas en el valle del río Cauca (cordillera occidental vertiente oriental y cordillera central vertiente occidental) se presenta mayor probabilidad de ocurrencia de eventos de lluvia tanto en horas de la tarde como en horas de la madrugada (entre 1 AM y 7 AM). Las estaciones ubicadas en la vertiente oriental de la cordillera central (valle del Magdalena) muestran mayor probabilidad de eventos de lluvia en las horas de la madrugada, mientras que las estaciones ubicadas en la vertiente occidental de la cordillera oriental (valle del Magdalena) muestran mayor probabilidad tanto en horas de la tarde como en horas de la madrugada, aunque en algunos casos se presentan altas probabilidades en horas de la noche (entre 7 PM y 1 AM). Por último, las estaciones ubicadas en la cordillera oriental vertiente oriental muestran mayor probabilidad de ocurrencia de eventos de lluvia en horas de la noche.
Una vez evaluados los parámetros para todas las series se pudo establecer que el valor del parámetro de asimetría, para cada uno de los cuartos y para todas las estaciones, es igual a 1, lo que permite afirmar, como era de esperarse, que todas las series son totalmente asimétricas a la derecha, esto debido al amplio rango que presentan los valores, a la gran cantidad de estos que se encuentran concentrados en los primeros percentiles de la distribución y a la alta intermitencia de los registros horarios.

Con respecto al índice de estabilidad , se encontró que para todos los casos su valor es menor que 2, por lo tanto es posible caracterizar las colas del 10% máximo de los datos de cada cuarto con funciones de distribución de colas pesadas.


En las Figura 3, Figura 4 y Figura 5 se muestra el histograma obtenido en la estimación de los parámetros , y en las 51 estaciones para cada uno de los cuartos del día.
De estos resultados se observa similitud entre los valores medios de los parámetros para los distintos cuartos. De la prueba Mann-Whitney, considerando un nivel de confiabilidad del 95%, lo que implica un valor de , y tomando uno de los cuartos como referencia, se encontró que es posible aceptar la hipótesis de igualdad de medias entre los cuartos de la tarde, la noche y la madrugada, para los parámetros , y. Este resultado permite definir un único arreglo de parámetros característicos para estos 3 cuartos (13 a19, 19 a 1 y 1 a 7), y otro para las horas de la mañana (7 a 13), con lo cual es posible estimar para determinado sitio en la región de Colombia estudiada, la función de distribución de probabilidades de las colas, para los datos que se encuentran por encima del percentil 90 de las distribuciones, aplicando las ecuaciones (6) y (8). La Tabla 1 muestra los parámetros obtenidos para los diferentes cuartos.



  1. Función de distribución acumulada para cada cuarto del día en algunas de las estaciones estudiadas.




  1. Corte transversal de los Andes tropicales de Colombia. La zona sombreada en el reloj correspondiente a cada vertiente, representa las horas del día en las cuales, en promedio, se presenta mayor cantidad de eventos de lluvia.




  1. Histograma de los valores del exponente característico () para cada uno de los cuartos del día.




  1. Histograma de los valores del parámetro localización () para cada uno de los cuartos del día.




  1. Histograma de los valores del parámetro de escala () para cada uno de los cuartos del día.

Estos parámetros permiten estimar, a través de las ecuaciones (6) y (8), la probabilidad asociada a la ocurrencia de un evento de magnitud menor o igual a un valor x de precipitación (este es el único dato necesario para estimar la función la probabilidad). Es de anotar que esta probabilidad sólo considera un 10% de los datos por lo que se debe sumar la probabilidad asociada al restante 90% de los datos que como se dijo anteriormente es casi en su totalidad compuesto por ceros.

Queda en estudio las aplicaciones de estos resultados.



  1. Valores de los parámetros característicos de las colas pesadas para las diferentes horas del día en los Andes Tropicales de Colombia.



Parámetro

Horas del día

Exponente característico ()

Asimetría ()

Localización ()


Escala

()



7am-1pm

0.892

1

-0.03

0.175

1pm-7pm


7pm-1am

1am-7am


1.078


1


0.557


0.642




4Conclusiones


Hemos estudiado las características de los valores extremos de las funciones de distribución de probabilidades de las lluvias horarias en 51 estaciones localizadas en los Andes Colombianos. En los registros de precipitación horaria se presenta una gran cantidad de valores de lluvia cero, lo que permite establecer que estos eventos son poco probables. El cuarto de día con menor probabilidad de ocurrencia de lluvia corresponde a aquel entre las 07 y las 13 horas, es decir, en la mañana. Hemos ratificado la naturaleza altamente intermitente de las lluvias horarias en los Andes de Colombia, lo cual es consistente con la caracterización de las colas con funciones de distribución de colas pesadas.

Las colas de la distribución, por su parte, presentan un comportamiento asociado a funciones de distribución estables de colas pesadas con una clara asimetría hacia la derecha y una alta intermitencia. Hemos establecido dos grupos de parámetros que definen estas funciones, uno para las horas del día entre las 13 y las 7 LST (=1.078, =1, =0.557 y =0.642), y el segundo para la caracterización de las horas de la mañana (=0.892, =1, =-0.03 y =0.175).



Agradecimientos

A Álvaro Jaramillo y Orlando Guzmán (Centro Nacional de Investigaciones de Café, Chinchiná) y a Empresas Públicas de Medellín por suministrar la información y por sus aportes para la realización de este trabajo.



Referencias

Agudelo P.A., Arias P.A., y Salazar L. F., Caracterización del ciclo diurno de precipitación en los Andes Tropicales de Colombia, Región Centro, Trabajo Dirigido de Grado, Ingeniería Civil, Facultad de Minas, Universidad Nacional de Colombia, Sede Medellín, 2001.

Álvarez, J.F y Toro, V.G, Caracterización del ciclo diurno de precipitación en los Andes tropicales de Colombia. Región Norte, Trabajo Dirigido de Grado, Ingeniería Civil, Facultad de Minas, Universidad Nacional de Colombia, Sede Medellín, 2001.

Montgomery, D. C. y Runger, G. C., Probabilidad y Estadística Aplicadas a la Ingeniería. McGraw-Hill. 1996.

Nolan, J. P., Numerical calculation of stable densities and distribution functions, Comm. in Stat. – Stochastic Models, 13: 759-774,1997.

Nolan, J. P., Parameterization and modes of stable distribution, Stat. and Prob. Letters, 38: 187-195,1998.

Poveda, G., H. Moreno, S.C. Vieira, P.A. Agudelo, P.A. Arias, L.F. Salazar, O.J. Mesa, J.F. Alvarez, V.G. Toro, A. Jaramillo y O. Guzmán, Caracterización del Ciclo Diurno de la Precipitación en los Andes Tropicales de Colombia. IX Congreso Latinoamericano e Ibérico de Meteorología – VII Congreso Argentino de Meteorología. Buenos Aires, Argentina, Mayo 7-11 de 2001.

Poveda, G., O. J. Mesa, P. A. Agudelo, J. F. Álvarez, P. A. Arias, H. A. Moreno, L. F. Salazar, V. G. Toro y S. C. Viera, Diagnóstico del Ciclo Diurno de la Precipitación en los Andes Tropicales de Colombia. VI Congreso Colombiano de Meteorología. Bogotá, Colombia, Marzo 20-22 de 2002.

Press, W. H., B. P, Flannery, P. Brian, S. Teukolsky, W. T. Vetterling, Numerical Recipes: The Art of Scientific Computing. Cambridge University Press, 1989.

Samorodnytsky, G. And Taqqu, M.S.,Stable Non Gaussian Random Processes. Chapman and Hall, NY, NY, 1994.



Vieira S. C., Moreno H., Caracterización del ciclo diurno de precipitación en los Andes Tropicales de Colombia, Región Sur, Trabajo Dirigido de Grado, Ingeniería Civil, Facultad de Minas, Universidad Nacional de Colombia, Sede Medellín, 2001.





La base de datos está protegida por derechos de autor ©espanito.com 2016
enviar mensaje