Loading...
4 results
Search Results
Now showing 1 - 4 of 4
- Statistical Modeling and Inference in Extremes: Applications with R. Biometrie und Medizinische InformatikPublication . Penalva, Helena Alexandra Couceiro Feio de Almeida; Nunes, Sandra Cristina Dias; Neves, Manuela
- Topics in data analysis using R in extreme value theoryPublication . Penalva, Helena Alexandra Couceiro Feio de Almeida; Neves, Manuela; Nunes, Sandra Cristina DiasThe Statistical Extreme Value Theory has grown gradually from the beginning of the 20th century. Its unquestionable importance in applications was definitely recognized after Gumbel’s book in 1958, Statistics of Extremes. Nowadays there is a wide number of applied sciences where extreme value statistics are largely used. So, accurately modeling extreme events has become more and more important and the analysis requires tools that must be simple to use but also should consider complex statistical models in order to produce valid inferences. To deal with accurate, friendly, free and open-source software is of great value for practitioners and researchers. This paper presents a review of the main steps for initializing a data analysis of extreme values in R environment. Some well documented packages are briefly described and two data sets will be considered for illustrating the use of some functions.
- Estimação do índice de valores extremos em ambiente R – as abordagens paramétrica e semi-paramétrica.Publication . Penalva, Helena Alexandra Couceiro Feio de Almeida; Nunes, Sandra Cristina Dias; Neves, Manuela
- Modelacão e estimacão de parâmetros de acontecimentos raros, em ambiente R: as abordagens paramétrica e semi-paramétricaPublication . Penalva, Helena Alexandra Couceiro Feio de Almeida; Nunes, Sandra Cristina Dias; Neves, ManuelaHistoricamente, as aplicações da Teoria de Valores Extremos iniciaram-se em duas principais áreas: a área ambiental, com o estudo dos níveis do mar, velocidade do vento, caudal dos rios, entre outros; e a área da fiabilidade. Actualmente, a Teoria de Valores Extremos tem surgido como uma das mais importantes áreas da Estatística utlizada em várias ciências aplicadas, tais como, a Biologia, a Geologia e risco sísmico, a Climatologia e o Ambiente, ver Coles (2001) e Beirlant et al. (2004). A Teoria de Valores Extremos pretende estimar e prever a-contecimentos que poderão ser mais extremos do que aqueles que alguma vez já foram observados. Assim, a inferência estatística somente pode ser deduzi da a partir das observações que são consideradas extremas num determinado contexto. O estudo do comportamento dos extremos de amostras de variáveis aleatórias pode ser feito usando duas abordagens: a paramétrica e a semi-paramétrica. Iremos tratar neste trabalho apenas a análise estatística de extremos uni variados. Em contexto paramétrico, o primeiro modelo de distribuições do máximo é o chamado Método dos Máximos Anuais, Método dos Máximos de Blocos ou ainda Método de Gumbel, que considera os k valores máximos de sub-amostras de tamanho r, n = k x r. Uma outra abordagem é a que considera a mo delação da distribuição de excessos acima de certo limiar, conhecida por Método POT (Peaks Over Thresholds), na qual se restringe a nossa atenção às observações que excedem um certo nível elevado, u. A abordagem semi-paramétrica teve a sua origem na escola holandesa com os trabalhos de de Haan (1970), e neste caso apenas se admite que o modelo F . subjacente aos dados da amostra verifica certas propriedades na cauda. Nestas distribuições, o parâmetro de forma, "f, designado por índice de cauda ou índice de valores extremos descreve o comportamento da cauda direita, 1- F, do modelo subjacente aos dados. A sua estimação precisa é muito importante e de enorme influência na estimação de outros parâmetros, tais como quantis elevados ou período de retorno de quantis elevados. Neste trabalho pretendese abordar a utilização do software R, (R Development Core Team, 2012) na estimação de parâmetros de acontecimentos raros, aplicando as abordagens paramétrica e semi-paramétrica. Para isso iremos escolher dois conjuntos de dados: um já tratado na literatura e outro conjunto de dados relativos a níveis médios diários na estação hidrométrica do rio Fraga.