1Universidad Externado de Colombia, Mathematics Department, Bogotá, Colombia. Lecturer. Email: juan.sosa@uexternado.edu.co
2Universidad Nacional de Colombia, Faculty of Science, Statistics Department, Bogotá, Colombia. Associated professor. Email: lgdiazm@unal.edu.co
A methodology to estimate a time-varying coefficient model through a linear combination of radial kernel functions which are centered around all the measuring times, or their quantiles is developed. The linear combination is weighted by a bandwidth that may change or not among coefficients. The proposed methodology is compared with the local polynomial kernel methods by means of a simulation study. The proposed methodology shows a better behavior in a high proportion of times in all cases, or at least it has a similar behavior in relation with the estimation through local polynomial kernel regression, that in a low rate of times has a better behavior in relation with the average mean square error. In order to illustrate the methodology the data set ACTG 315 related with an AIDS study is taken into account. The dynamic relationship between the viral load and the CD4+ cell counts is investigated.
Key words: Cross validation, Kernel function, Longitudinal data analysis, Mixed model.
Se propone una metodología para estimar los coeficientes de un modelo de coeficientes dinámicos y aleatorios a través de una combinación lineal de funciones radiales kernel centradas en los diferentes puntos de medición, o en cuantiles de éstos, escalada por un ancho de banda que puede cambiar de coeficiente a coeficiente. En un estudio de simulación se compara la metodología propuesta con la estimación mediante los métodos de polinomios locales kernel, obteniéndose que la nueva metodología propuesta es la mejor opción en un alto porcentaje de veces para todos los escenarios simulados, o por lo menos se desempeña similarmente a la estimación a través de la regresión de polinomios locales kernel, que pocas veces se desempeña mejor que la estimación mediante funciones radiales kernel, en relación al error cuadrático medio promedio. Para ilustrar la estrategia de estimación propuesta se considera el conjunto de datos ACTG 315 asociado con un estudio del SIDA, en el que se modela dinámicamente la relación entre la carga viral y el conteo de células CD4+.
Palabras clave: análisis de datos longitudinales, función kernel, modelo mixto, validación cruzada.
Texto completo disponible en PDF
References
1. Altman, N. S. (1990), `Kernel smoothing of data with correlated errors´, Journal of the American Statistical Association 85(411), 749-759.
2. Bates, D., Maechler, M. & Bolker, B. (2011), lme4: Linear Mixed-Effects Models Using S4 classes. R package version 0.999375-42. *http://CRAN.R-project.org/packagelme4
3. Davis, C. S. (2000), Statistical Methods for the Analysis of Repeated Measurements, Springer.
4. Diggle, P. J., Liang, K. Y. & Zeger, S. L. (1994), Analysis of Longitudinal Data, Oxford University Press.
5. Fitzmaurice, G., Davidian, M., Verbeke, G. & Molenberghs, G. (2009), Longitudinal Data Analysis, Champman & Hall.
6. Guo, W. (2002), `Functional mixed effects models´, Biometrics 58(1), 121-128.
7. Hart, J. D. (1991), `Kernel regression estimation with time series errors´, Journal of the Royal Statistical Society. Series B (Methodological) 53(1), 173-187.
8. Hart, J. D. & Wehrly, T. E. (1986), `Kernel regression estimation using repeated measurements data´, Journal of the American Statistical Association 81(396), 1080-1088.
9. Hastie, T., Tibshirani, R. & Friedman, J. (1990), The elements of Statistical Learning, Springer.
10. Hoover, D. R., Rice, J. A., Wu, C. O. & Yang, L. P. (1998), `Nonparametric smoothing estimates of time-varying coefficient models with longitudinal data´, Biometrika 85(4), 809-822.
11. Huang, J. Z., Wu, C. O. & Zhou, L. (2002), `Varying-coefficient models and basis function approximations for the analysis of repeated measurements´, Biometrika 89(1), 111-128.
12. Liang, H., Wu, H. & Carroll, R. J. (2003), `The relationship between virologic and immunologic responses in AIDS clinical research using mixed-effects varying-coefficient models with measurement error´, Biostatistics 4(2), 297-312.
13. R Development Core Team, (2008), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0. *http://www.R-project.org
14. Rice, J. A. & Silverman, B. W. (1991), `Estimating the mean and covariance structure nonparametrically when the data are curves´, Journal of the Royal Statistical Society. Series B (Methodological) 53(1), 233-243.
15. Sosa, J. C. & Díaz, L. G. (2010), `Estimación de las componentes de un modelo de coeficientes dinámicos mediante las ecuaciones de estimación generalizadas´, Revista Colombiana de Estadística 33(1), 89-109.
16. Verbeke, G. & Molenberghs, G. (2005), Models for Discrete Longitudinal Data, Springer.
17. Wu, H. & Liang, H. (2004), `Backing random varying-coefficient models with time-dependent smoothing covariates´, Scandinavian Journal of Statistics 31, 3-19.
18. Wu, H. & Zhang, J. T. (2006), Nonparametric Regression Methods for Longitudinal Data Analysis, Wiley.
19. Zeger, S. L. & Diggle, P. J. (1994), `Semiparametric models for longitudinal data with application to CD4 cell numbers in HIV seroconverters´, Biometrics 50(3), 689-699.
Este artículo se puede citar en LaTeX utilizando la siguiente referencia bibliográfica de BibTeX:
@ARTICLE{RCEv35n1a10,
AUTHOR = {Sosa, Juan Camilo and Díaz, Luis Guillermo},
TITLE = {{Random Time-Varying Coefficient Model Estimation through Radial Basis Functions}},
JOURNAL = {Revista Colombiana de Estadística},
YEAR = {2012},
volume = {35},
number = {1},
pages = {167-184}
}