Uma alternativa para diagnóstico e análise de dados multinomiais com superdispersão: aplicação à Fruticultura.

Conteúdo do artigo principal

Maria Letícia SALVADOR
Eduardo Elías RIBEIRO JUNIOR
César Augusto TACONELI
Idemauro Antonio Rodrigues LARA

Resumo

Em experimentos agronômicos é comum a presença de variáveis politômicas e o modelo dos logitos generalizados é uma classe de modelos de regressão que podem ser empregadas para a análise desses dados. Uma das características do modelo dos logitos generalizados é a pressuposição de que a variância é uma função conhecida da média e, espera-se que a variância observada esteja próxima da pressuposta pelo modelo. No entanto, não é raro ocorrer uma variação extra-multinomial, devido à observação sistemática de dados mais heterogêneos do que a variância especificada pelo modelo, fenômeno este conhecido como superdispersão. Neste contexto, o presente trabalho tem como objetivo discutir a importância de diagnosticar o problema da superdispersão em dados multinomiais, com proposta de uma medida descritiva para diagnóstico,
assim como apresentar uma alternativa metodológica por meio do modelo Dirichletmultinomial. A medida descritiva foi avaliada por meio de simulação, restringindo-se a dois cenários particulares. Como um estudo de motivação tem-se um experimento
aplicado à fluticultura, cujo o objetivo foi avaliar o florescimento de plantas adultas de uma laranjeira, enxertadas sobre o limão “Cravo” e o citrumelo “Swingle”, tendo com variável resposta à classificação de ramos das plantas em três categorias: terminal, lateral, sem flor ou abortada. Por meio da medida descritiva proposta verificou-se evidências de superdispersão, indicando que o modelo dos logitos generalizados pode não ser o mais apropriado. Dessa forma, como alternativa metodológica utilizou-se o modelo Dirichlet-multinomial. Comparativamente ao modelo dos logitos generalizados
o Dirichlet-multinomial mostrou-se mais adequado para o ajuste de dados com
superdispersão por permitir a inclusão de um parâmetro adicional para acomodar a dispersão excessiva extra-multinomail.

Detalhes do artigo

Como Citar
SALVADOR, M. L., RIBEIRO JUNIOR, E. E., TACONELI, C. A., & LARA, I. A. R. . (2022). Uma alternativa para diagnóstico e análise de dados multinomiais com superdispersão: aplicação à Fruticultura. REVISTA BRASILEIRA DE BIOMETRIA, 40(3). https://doi.org/10.28951/bjb.v40i3.584
Seção
Articles

Referências

AGRESTI, An introduction to categorical data analysis, John Wiley & Sons, 2019.

CHEN, J.; LI, H.Variable selection for sparse Dirichlet-multinomial regression with an application to microbiome data analysis. Annals of Applied Statistics, v.7, n.1, p.418–442, 2013. ISSN 19326157.

FREITAS, S. M. Modelos para proporções com superdispersão provenienetes de ensaios toxicológicos no tempo. 124p. Tese (Doutorado) — Universidade de São Paulo / Escola Superior Agricola "Luiz de Queiroz", 2001.

MORAL, R. A.; HINDE, J.; DEMÉTRIO, C. G. B. Half-Normal Plots and Overdispersed Models in R : The hnp Package. Journal of Statistical Software, v.8, n.10, 23p., 2017.

MORAL, R. d. A.; HINDE, J.; DEMÉTRIO, C. G. B. Half-Normal Plots with Simulation Envelopes. [S.l.]: 2018-05-21, 2018. 28p.

MOREL, J. G.; NAGARAJ, N. K. A Finite Mixture Distribution for Modelling Multinomial Extra Variation. Biometrika Trust, Oxford University Press, v.80, n.2, p.363–371, 1992.

MOSIMANN, J. E. On the Compound Multinomial Distribution , the Multivariate β- Distribution , and Correlations Among Proportions. Biometrika Trust, Oxford University Press, v.49, n. 1, p.65–82, 1962.

NELDER, J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. v.135, n.3, p.370–384, 1972.

OLSSON, U. Generalized Linear Models An Applied Approach. [S.l.]: Lund: Studentlitteratur, 2002. 232p. ISBN 9789144031415.

PAUL, S. R.; LIANG, K. Y.; SELF, S. G. On Testing Departure from the Binomialand Multinomial Assumptions. v.45, n.1, p.231–236, 1989.

VENABLES, W. N.; RIPLEY, B. D. Modern Applied Statistics with S. Fourth. New York: Springer, 2002. ISBN 0-387-95457-0.

VOIGT, V. Caracterização fenotípica e avaliação da expressão de genes envolvidos na indução e no florescimento da laranjeirax11. Tese (Doutorado) — Universidadede São Paulo, 2013.

ZHANG, Y.; ZHOU, H.Mglm: Multivariate response generalized linear models. R package version 0.2.0, v.7, 2016.