Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.

A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no... Ver más

Guardado en:

2011-2084

2011-7922

3

2010-06-30

78

87

International Journal of Psychological Research - 2010

info:eu-repo/semantics/openAccess

http://purl.org/coar/access_right/c_abf2

id 16c89741bf3fc51abf0ebac9ac3ec5c9
record_format ojs
spelling Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
Artículo de revista
valores extremos
diagnostico
regresión
ANOVA
métodos robustos
A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no afectan los datos permitiendo una interpretación más adecuada de los mismos. Se presenta un tutorial paso a paso de un análisis descriptivo que le permita a los investigadores hacer una revisión inicial del método más apropiado para analizar los datos. Luego, se compara el ANOVA y la regresión tradicional con su versión robusta para discutir sus ventajas y desventajas. Finalmente, se presentan diagramas de los residuales de los análisis y que pueden usarse para determinar si las condiciones de aplicación de los análisis son apropiadas. Se usan ejemplos tomados de la investigación en psicología para ilustrar los argumentos acá expuestos, y se presenta un código en lenguaje R para que el lector use las técnicas acá presentadas.
http://purl.org/coar/resource_type/c_6501
info:eu-repo/semantics/article
International Journal of Psychological Research - 2010
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/version/c_970fb48d4fbd8a85
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
Text
https://creativecommons.org/licenses/by-nc-sa/4.0/
Inglés
https://revistas.usb.edu.co/index.php/IJPR/article/view/849
International Journal of Psychological Research
Universidad San Buenaventura - USB (Colombia)
application/pdf
Publication
diagnostic
Journal article
After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article.
S. Courvoisier, Delphine
Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology
Renaud, Olivier
robust methods
1
3
outliers
ANOVA
regression
2010-06-30T00:00:00Z
78
https://revistas.usb.edu.co/index.php/IJPR/article/download/849/604
87
2010-06-30T00:00:00Z
https://doi.org/10.21500/20112084.849
10.21500/20112084.849
2011-7922
2011-2084
2010-06-30
institution UNIVERSIDAD DE SAN BUENAVENTURA
thumbnail https://nuevo.metarevistas.org/UNIVERSIDADDESANBUENAVENTURA_COLOMBIA/logo.png
country_str Colombia
collection International Journal of Psychological Research
title Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
spellingShingle Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
S. Courvoisier, Delphine
Renaud, Olivier
valores extremos
diagnostico
regresión
ANOVA
métodos robustos
diagnostic
robust methods
outliers
ANOVA
regression
title_short Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
title_full Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
title_fullStr Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
title_full_unstemmed Análisis robusto de la tendencia central, regresión simple, múltiple y ANOVA: Un tutorial paso a paso.
title_sort análisis robusto de la tendencia central, regresión simple, múltiple y anova: un tutorial paso a paso.
description A menudo, métodos clásicos como la media, la regresión simple y múltiple, y el análisis de varianza (ANOVA), requieren que los datos se distribuyan normalmente y estén exentos de valores extremos, lo que en práctica es inusual. Los investigadores típicamente usan métodos como la detección y eliminación de valores extremos como una medida para que los datos se ajusten a los requerimientos de los métodos clásicos. En este artículo se muestran las desventajas tal práctica. En particular, se muestra que los valores extremos algunas veces pueden ser difíciles de detectar afectando así la interpretación de los resultados. Se propone entonces un método más apropiado y moderno que se basta en procedimientos robustos en donde los valores extremos no afectan los datos permitiendo una interpretación más adecuada de los mismos. Se presenta un tutorial paso a paso de un análisis descriptivo que le permita a los investigadores hacer una revisión inicial del método más apropiado para analizar los datos. Luego, se compara el ANOVA y la regresión tradicional con su versión robusta para discutir sus ventajas y desventajas. Finalmente, se presentan diagramas de los residuales de los análisis y que pueden usarse para determinar si las condiciones de aplicación de los análisis son apropiadas. Se usan ejemplos tomados de la investigación en psicología para ilustrar los argumentos acá expuestos, y se presenta un código en lenguaje R para que el lector use las técnicas acá presentadas.
description_eng After much exertion and care to run an experiment in social science, the analysis of data should not be ruined by an improper analysis. Often, classical methods, like the mean, the usual simple and multiple linear regressions, and the ANOVA require normality and absence of outliers, which rarely occurs in data coming from experiments. To palliate to this problem, researchers often use some ad-hoc methods like the detection and deletion of outliers. In this tutorial, we will show the shortcomings of such an approach. In particular, we will show that outliers can sometimes be very difficult to detect and that the full inferential procedure is somewhat distorted by such a procedure. A more appropriate and modern approach is to use a robust procedure that provides estimation, inference and testing that are not influenced by outlying observations but describes correctly the structure for the bulk of the data. It can also give diagnostic of the distance of any point or subject relative to the central tendency. Robust procedures can also be viewed as methods to check the appropriateness of the classical methods. To provide a step-by-step tutorial, we present descriptive analyses that allow researchers to make an initial check on the conditions of application of the data. Next, we compare classical and robust alternatives to ANOVA and regression and discuss their advantages and disadvantages. Finally, we present indices and plots that are based on the residuals of the analysis and can be used to determine if the conditions of applications of the analyses are respected. Examples on data from psychological research illustrate each of these points and for each analysis and plot, R code is provided to allow the readers to apply the techniques presented throughout the article.
author S. Courvoisier, Delphine
Renaud, Olivier
author_facet S. Courvoisier, Delphine
Renaud, Olivier
topicspa_str_mv valores extremos
diagnostico
regresión
ANOVA
métodos robustos
topic valores extremos
diagnostico
regresión
ANOVA
métodos robustos
diagnostic
robust methods
outliers
ANOVA
regression
topic_facet valores extremos
diagnostico
regresión
ANOVA
métodos robustos
diagnostic
robust methods
outliers
ANOVA
regression
citationvolume 3
citationissue 1
citationedition Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology
publisher Universidad San Buenaventura - USB (Colombia)
ispartofjournal International Journal of Psychological Research
source https://revistas.usb.edu.co/index.php/IJPR/article/view/849
language Inglés
format Article
rights International Journal of Psychological Research - 2010
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
https://creativecommons.org/licenses/by-nc-sa/4.0/
type_driver info:eu-repo/semantics/article
type_coar http://purl.org/coar/resource_type/c_6501
type_version info:eu-repo/semantics/publishedVersion
type_coarversion http://purl.org/coar/version/c_970fb48d4fbd8a85
type_content Text
publishDate 2010-06-30
date_accessioned 2010-06-30T00:00:00Z
date_available 2010-06-30T00:00:00Z
url https://revistas.usb.edu.co/index.php/IJPR/article/view/849
url_doi https://doi.org/10.21500/20112084.849
issn 2011-2084
eissn 2011-7922
doi 10.21500/20112084.849
citationstartpage 78
citationendpage 87
url2_str_mv https://revistas.usb.edu.co/index.php/IJPR/article/download/849/604
_version_ 1797920203857723392