Detección y tratamiento de valores extremos: una revisión

Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro... Ver más

Guardado en:

2011-2084

2011-7922

3

2010-06-30

58

67

info:eu-repo/semantics/openAccess

http://purl.org/coar/access_right/c_abf2

International Journal of Psychological Research - 2010

id a7b54b3420ce9749c64a3dec9cbe9aae
record_format ojs
spelling Detección y tratamiento de valores extremos: una revisión
intervalos de confianza
Artículo de revista
aproximación Bayesiana
encuestas nacionales
representación gráfica
Detección y tratamiento de valores extremos: una revisión
estadística de los intervalos
guías
Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones.
http://purl.org/coar/resource_type/c_6501
info:eu-repo/semantics/publishedVersion
http://purl.org/coar/version/c_970fb48d4fbd8a85
info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
Text
info:eu-repo/semantics/article
Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352.
International Journal of Psychological Research - 2010
https://creativecommons.org/licenses/by-nc-sa/4.0/
Inglés
https://revistas.usb.edu.co/index.php/IJPR/article/view/844
International Journal of Psychological Research
application/pdf
Universidad San Buenaventura - USB (Colombia)
1
Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case.
Cousineau, Denis
Chartier, Sylvain
Statistics
outlier detection
outlier treatment
3
Publication
Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology
Journal article
58
2010-06-30
https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601
2010-06-30T00:00:00Z
https://doi.org/10.21500/20112084.844
10.21500/20112084.844
2010-06-30T00:00:00Z
2011-7922
2011-2084
67
institution UNIVERSIDAD DE SAN BUENAVENTURA
thumbnail https://nuevo.metarevistas.org/UNIVERSIDADDESANBUENAVENTURA_COLOMBIA/logo.png
country_str Colombia
collection International Journal of Psychological Research
title Detección y tratamiento de valores extremos: una revisión
spellingShingle Detección y tratamiento de valores extremos: una revisión
Cousineau, Denis
Chartier, Sylvain
intervalos de confianza
aproximación Bayesiana
encuestas nacionales
representación gráfica
estadística de los intervalos
guías
Statistics
outlier detection
outlier treatment
title_short Detección y tratamiento de valores extremos: una revisión
title_full Detección y tratamiento de valores extremos: una revisión
title_fullStr Detección y tratamiento de valores extremos: una revisión
title_full_unstemmed Detección y tratamiento de valores extremos: una revisión
title_sort detección y tratamiento de valores extremos: una revisión
description Los valores extremos son observaciones o medidas que son sospechosas en tanto que son mucho menores o mucho mayores que el resto de las observaciones. Estas observaciones son problemáticas en tanto que puede que no sean causadas por los procesos mentales que están siendo estudiados o puede que no reflejen la habilidad que se está estudiando. El problema es que unas pocas observaciones extremas son suficientes para distorsionar los resultados (alterando el desempeño medio, incrementando la variabilidad, etc.). En este artículo se revisan varias técnicas diseñadas para detectar observaciones extremas. Estas técnicas se subdividen en dos clases, aquellas relacionadas con datos univariados y aquellas relacionadas con datos multivariados. Dentro de estas dos clases, se consideran casos en que la distribución de la población es asumida como normal, casos en que la distribución es normal pero no conocida, o casos en que la población es desconocida. Para cada escenario se proponen algunas recomendaciones.
description_eng Outliers are observations or measures that are suspicious because they are much smaller or much larger than the vast majority of the observations. These observations are problematic because they may not be caused by the mental process under scrutiny or may not reflect the ability under examination. The problem is that a few outliers is sometimes enough to distort the group results (by altering the mean performance, by increasing variability, etc.). In this paper, various techniques aimed at detecting potential outliers are reviewed. These techniques are subdivided into two classes, the ones regarding univariate data and those addressing multivariate data. Within these two classes, we consider the cases where the population distribution is known to be normal, the population is not normal but known, or the population is unknown. Recommendations will be put forward in each case.
author Cousineau, Denis
Chartier, Sylvain
author_facet Cousineau, Denis
Chartier, Sylvain
topicspa_str_mv intervalos de confianza
aproximación Bayesiana
encuestas nacionales
representación gráfica
estadística de los intervalos
guías
topic intervalos de confianza
aproximación Bayesiana
encuestas nacionales
representación gráfica
estadística de los intervalos
guías
Statistics
outlier detection
outlier treatment
topic_facet intervalos de confianza
aproximación Bayesiana
encuestas nacionales
representación gráfica
estadística de los intervalos
guías
Statistics
outlier detection
outlier treatment
citationvolume 3
citationissue 1
citationedition Núm. 1 , Año 2010 : Special Issue of Statistics in Psychology
publisher Universidad San Buenaventura - USB (Colombia)
ispartofjournal International Journal of Psychological Research
source https://revistas.usb.edu.co/index.php/IJPR/article/view/844
language Inglés
format Article
rights info:eu-repo/semantics/openAccess
http://purl.org/coar/access_right/c_abf2
International Journal of Psychological Research - 2010
https://creativecommons.org/licenses/by-nc-sa/4.0/
references_eng Bamber, D. (1969). Reaction times and error rates for "same"-"different" judgments of multidimensional stimuli. Perception and Psychophysics, 6, 169-174. Belsley, D. A., Kuh, E., & Welsch, R. E. (1980). Regression diagnostics : identifying influential data and sources of collinearity. Wiley series in probability and mathematical statistics. New York: John Wiley & Sons. Cook, R. D. (1977). Detection of influatial observation in linear regression. Technometrics, 19, 15-18. Cousineau, D., & Shiffrin, R. M. (2004). Termination of a visual search with large display size effect. Spatial Vision, 17, 327-352.
type_driver info:eu-repo/semantics/article
type_coar http://purl.org/coar/resource_type/c_6501
type_version info:eu-repo/semantics/publishedVersion
type_coarversion http://purl.org/coar/version/c_970fb48d4fbd8a85
type_content Text
publishDate 2010-06-30
date_accessioned 2010-06-30T00:00:00Z
date_available 2010-06-30T00:00:00Z
url https://revistas.usb.edu.co/index.php/IJPR/article/view/844
url_doi https://doi.org/10.21500/20112084.844
issn 2011-2084
eissn 2011-7922
doi 10.21500/20112084.844
citationstartpage 58
citationendpage 67
url2_str_mv https://revistas.usb.edu.co/index.php/IJPR/article/download/844/601
_version_ 1797160045892337664