Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no... Ver más
2011-2084
2011-7922
3
2010-06-30
78
87
International Journal of Psychological Research - 2010
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
id |
16c89741bf3fc51abf0ebac9ac3ec5c9 |
---|---|
record_format |
ojs |
spelling |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. Artículo de revista valores extremos diagnostico regresión ANOVA métodos robustos A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no afectan los datos permitiendo una interpretación más adecuada de los mismos. Se presenta un tutorial paso a paso de un análisis descriptivo que le permita a los investigadores hacer una revisión inicial del método más apropiado para analizar los datos. Luego, se compara el ANOVA y la regresión tradicional con su versión robusta para discutir sus ventajas y desventajas. Finalmente, se presentan diagramas de los residuales de los análisis y que pueden usarse para determinar si las condiciones de aplicación de los análisis son apropiadas. Se usan ejemplos tomados de la investigación en psicología para ilustrar los argumentos acá expuestos, y se presenta un código en lenguaje R para que el lector use las técnicas acá presentadas. http://purl.org/coar/resource_type/c_6501 info:eu-repo/semantics/article International Journal of Psychological Research - 2010 info:eu-repo/semantics/publishedVersion http://purl.org/coar/version/c_970fb48d4fbd8a85 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 Text https://creativecommons.org/licenses/by-nc-sa/4.0/ Inglés https://revistas.usb.edu.co/index.php/IJPR/article/view/849 International Journal of Psychological Research Universidad San Buenaventura - USB (Colombia) application/pdf Publication diagnostic Journal article After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article. S. Courvoisier, Delphine Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology Renaud, Olivier robust methods 1 3 outliers ANOVA regression 2010-06-30T00:00:00Z 78 https://revistas.usb.edu.co/index.php/IJPR/article/download/849/604 87 2010-06-30T00:00:00Z https://doi.org/10.21500/20112084.849 10.21500/20112084.849 2011-7922 2011-2084 2010-06-30 |
institution |
UNIVERSIDAD DE SAN BUENAVENTURA |
thumbnail |
https://nuevo.metarevistas.org/UNIVERSIDADDESANBUENAVENTURA_COLOMBIA/logo.png |
country_str |
Colombia |
collection |
International Journal of Psychological Research |
title |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
spellingShingle |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. S. Courvoisier, Delphine Renaud, Olivier valores extremos diagnostico regresión ANOVA métodos robustos diagnostic robust methods outliers ANOVA regression |
title_short |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_full |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_fullStr |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_full_unstemmed |
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso. |
title_sort |
análisis robusto de la tendencia central, regresión simple, múltiple y anova: un tutorial paso a paso. |
description |
A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no afectan los datos permitiendo una interpretación más adecuada de los mismos. Se presenta un tutorial paso a paso de un análisis descriptivo que le permita a los investigadores hacer una revisión inicial del método más apropiado para analizar los datos. Luego, se compara el ANOVA y la regresión tradicional con su versión robusta para discutir sus ventajas y desventajas. Finalmente, se presentan diagramas de los residuales de los análisis y que pueden usarse para determinar si las condiciones de aplicación de los análisis son apropiadas. Se usan ejemplos tomados de la investigación en psicología para ilustrar los argumentos acá expuestos, y se presenta un código en lenguaje R para que el lector use las técnicas acá presentadas.
|
description_eng |
After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article.
|
author |
S. Courvoisier, Delphine Renaud, Olivier |
author_facet |
S. Courvoisier, Delphine Renaud, Olivier |
topicspa_str_mv |
valores extremos diagnostico regresión ANOVA métodos robustos |
topic |
valores extremos diagnostico regresión ANOVA métodos robustos diagnostic robust methods outliers ANOVA regression |
topic_facet |
valores extremos diagnostico regresión ANOVA métodos robustos diagnostic robust methods outliers ANOVA regression |
citationvolume |
3 |
citationissue |
1 |
citationedition |
Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology |
publisher |
Universidad San Buenaventura - USB (Colombia) |
ispartofjournal |
International Journal of Psychological Research |
source |
https://revistas.usb.edu.co/index.php/IJPR/article/view/849 |
language |
Inglés |
format |
Article |
rights |
International Journal of Psychological Research - 2010 info:eu-repo/semantics/openAccess http://purl.org/coar/access_right/c_abf2 https://creativecommons.org/licenses/by-nc-sa/4.0/ |
type_driver |
info:eu-repo/semantics/article |
type_coar |
http://purl.org/coar/resource_type/c_6501 |
type_version |
info:eu-repo/semantics/publishedVersion |
type_coarversion |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
type_content |
Text |
publishDate |
2010-06-30 |
date_accessioned |
2010-06-30T00:00:00Z |
date_available |
2010-06-30T00:00:00Z |
url |
https://revistas.usb.edu.co/index.php/IJPR/article/view/849 |
url_doi |
https://doi.org/10.21500/20112084.849 |
issn |
2011-2084 |
eissn |
2011-7922 |
doi |
10.21500/20112084.849 |
citationstartpage |
78 |
citationendpage |
87 |
url2_str_mv |
https://revistas.usb.edu.co/index.php/IJPR/article/download/849/604 |
_version_ |
1797920203857723392 |