ResearchPDF Available

Analizando la V de Aiken Usando el Método Score con Hojas de Cálculo

June 2015

June 2015

Authors:

SASEMAR-Spain

Despite the widespread use of factor V Aiken to measure interrater agreement when constructing and validating questionnaires, their calculation is not included in statistical packages such as SPSS and tends to compute by hand, which can be cumbersome and leads to errors. Giacobbi and Penfield (2004) proposed an improved Aiken based method using confidence intervals, we thought worth followed, and according to the guidelines of the APA (Deckers, 2001) and Wilkinson (1999) on the quantification of content validity. Using spreadsheets overcomes the limitations associated with the use of MS Windows based platform programs as Soto & Segovia, (2009) , in terms of modifiability and distribution.

Content uploaded by Jose R. Cordon

Content may be subject to copyright.

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 1

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

Analizando la V de Aiken Usando el Método Score con Hojas de Cálculo.

Analyzing V Aiken's Content Validity using Score Method with Spreadsheets.

José Rodríguez Cordón

Universidad de Cádiz

Keywords: V Aiken; Content Validity; Validity; Score Method; Spreadsheet;excel;calc;psicometry

Palabras clave: Validez de contenido;V de Aiken;intervalos de confianza;psicometría;validez;hoja

de cálculo;excel;calc;score

Dirección de contacto: Para cualquier contacto usar el email josercordon@gmail.com o

joserc@sasemar.es .

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 2

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

Resumen

A pesar de la extensión del uso del coeficiente V de Aiken para medir el acuerdo

interjueces a la hora de construir y validar cuestionarios, su cálculo no está incluido en paquetes

estadisticos como SPSS y se tiende a computar a mano, lo que puede resultar engorroso y enducir

a errores. Penfield y Giacobbi (2004) propusieron una mejora en el Método de Aiken utilizando

intervalos de confianza, que pensamos merece la pena seguirse, según las directrices de la APA

(Deckers, 2001) y de Wilkinson (1999) sobre la cuantificación de la validez de contenido. El uso

de hojas de cálculo supera las limitaciones de utilizar programas ligados a la plataforma MS

Windows como el de Soto & Segovia (2009), en cuanto a modificabilidad y distribución.

Abstract

Despite the widespread use of factor V Aiken to measure interrater agreement when

constructing and validating questionnaires, their calculation is not included in statistical packages

such as SPSS and tends to compute by hand, which can be cumbersome and leads to errors.

Giacobbi and Penfield (2004) proposed an improved Aiken based method using confidence

intervals, we thought worth followed, and according to the guidelines of the APA (Deckers,

2001) and Wilkinson (1999) on the quantification of content validity. Using spreadsheets

overcomes the limitations associated with the use of MS Windows based platform programs as

Soto & Segovia, (2009) , in terms of modifiability and distribution.

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 3

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

Introducción

Una buena parte de los cuestionarios y escalas que se utilizan en la práctica psicológica se

han construido en una primera fase sometiendo los ítems a prueba de jueces, sin embargo los

grandes paquetes estadísticos no proporcionan una manera rápida de realizar esta prueba, por lo

que en la mayoría de las ocasiones se recurre a realizar su cálculo a mano, lo que puede resultar

engorroso y enducir a errores. Por otra parte, la utilización cada vez más extendida de

cuestionarios on-line, cuyos resultados se obtienen automáticamente en formato de hoja de

cálculo -la plataforma de google (“Google Drive,” n.d.)es un buen ejemplo de ello- lleva a la

conclusión inmediata de desarrollar una hoja de cálculo con las fórmulas necesarias para realizar

esta prueba de manera automática y que además proporcione de un vistazo el criterio de decisión

sobre el mantenimiento o rechazo de cada ítem.

Método

Al afrontar la elaboración de escalas para la medición de constructos psicológicos

normalmente el investigador se encuentra con la disyuntiva de utilizar diversas medidas para

evaluar el acuerdo interjueces, tal como se expone en el trabajo de Escurra (1988). Como

sabemos, realmente lo que estamos tratando de evaluar es la validez de contenido, y según Aiken

(1980) la forma por excelencia de hacerlo es mediante el acuerdo entre jueces entendidos en la

materia.

De acuerdo con Escurra (1988), que analiza el uso de la prueba binomial, el coeficiente V

de Aiken (Aiken, 1980), y el índice simple de acuerdo y comparando sus resultados, concluye que

el más pertinente para su utilización es el V, ya que “ya que tiene la facilidad del cómputo del lA

y la posibilidad de la contrastación estadística de la PB” (Escurra, 1988, p.6), descartando

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 4

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

completamente el Índice de Acuerdo, al carecer este índice de significación estadística, lo que

podría significar arbitrariedad (Escurra, 1988).

De cualquier modo, este índice V luego debe ser contrastado con una tabla de valores que

ofrece el criterio de retención o eliminación del ítem en función del número de jueces, en función

de un valor crítico de V=0,5. Para obviar esto, Penfield & Giacobbi Peter R (2004) modificaron

la ecuación de Aikenpara utilizar un método de decisión basado en intervalos de confianza, que

vienen a representar la probabilidad de ocurrencia de un suceso en una población dado un nivel de

confianza determinado por el investigador. Tal como explica Soto en su trabajo, “la justificación

de utilizar intervalos de confianza para la cuantificación de la validez de contenido va de

acuerdo con el actual énfasis de su uso para reportar hallazgos de investigación psicológica”

(APA, 2000; Soto & Segovia, 2009; Wilkinson, 1999).

La fórmula modificada por Penfield y Giacobbi queda de esta manera:

V=̄

X−l

(1) siendo

la media de las calificaciones de los jueces, l la mínima calificación

de la escala, y k el rango de la escala utilizada.

Para el cálculo de los intervalos de confianza, los autores recurren al método score de

Wilson (1927) el cual no presenta restricciones en cuanto a normalidad de distribución de la

variable, es asimétrico y altamente exacto (Soto & Segovia, 2009).

El límite inferior del intervalo queda definido por la fórmula:

L=2nkV+z2−z∗

√

4nkV(1−V)+ z2

2(nk +z2)

(2) y el superior:

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 5

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

U=2nkV+z2+z∗

√

4nkV(1−V)+ z2

2(nk +z2)

(3), siendo Z el valor de la distribución normal de

probabilidad, V la de Aiken calculada en la fórmula (1), y n el número de jueces. Mayor

explicación del método se puede encontrar en Soto & Segovia(2009).

Uso de la Hoja de Cálculo

La hoja de cálculo permite simplemente copiar y pegar las celdas obtenidas de los

cuestionarios online o introducidos en ella manualmente, y ofrece estos cálculos de manera

automática, tan sólo se debe elegir el criterio de exclusión de ítems, para ello se ofrecen niveles

liberales V0=0,5 (Cicchetti, 1994) o más restrictivos como V0=0,70 (Charter, 2003) o más aún

como V0=0,80. De igual forma se puede decidir el nivel de confianza del intervalo del desplegable,

existiendo opciones para 90-95-97,5-99 y 99,9%, por simplificación y para evitar que usuarios

inexpertos manipulen esta celda, pero uno con mínima experiencia en hojas de cálculo puede

fácilmente incluir otros niveles.

Se pueden ampliar el número de ítems con tan solo copiar/pegar las celdas necesarias,

completando el proceso con las celdas inferiores donde se realizan los cálculos. El usuario debe

abstenerse de modificar las celdas protegidas o que contengan fórmulas, para no alterar los

cálculos, para ello, las celdas que no deben modificarse se han sombreado en negro. Tampoco se

debe modificar el formato de celdas ya que no aparecerían en rojo los ítems fuera de rango.

Deben completarse también las casillas de mínimo de escala y del rango de valores de la

misma, se ha preferido mantenerlo así en aras de la flexibilidad y dado que en una hoja de cálculo

existe la posibilidad de copiar y pegar, es más sencillo que mediante fórmulas de cálculo

automático.

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 6

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

Del mismo modo que en el programa de Soto & Segovia(2009), pero de un modo muy

visual e interactivo se da la posibilidad al investigador de, mediante la modificación de diversos

parámetros, como la significación o el número de jueces, ajustar su prueba para que cumpla con

los requisitos exigidos al planificar la investigación.

Disponibilidad

La hoja de cálculo está disponible en formatos (“LibreOffice,” 2014) y MS Excel, a

elección del usuario y se distribuye bajo licencia Reconocimiento – NoComercial (by-nc): Se

permite la generación de obras derivadas siempre que no se haga un uso comercial. Tampoco se

puede utilizar la obra original con finalidades comerciales (“Licencias - Creative Commons,”

2014). Cualquier comentario y aportaciones es bienvenido al email del autor.

Pueden ser descargadas desde las url:

https://www.dropbox.com/s/2mfdqqxqyazjbl6/prueba_V.xlsx

https://www.dropbox.com/s/ssyma37ttwduoqn/V_Aiken.ods

Referencias

Aiken, L. R. (1980). Content Validity and Reliability of Single Items or Questionnaires.

Educational and Psychological Measurement, 40(4), 955–959.

doi:10.1177/001316448004000419

APA. (2001). APA Format–6, (2000), 1–4.

Cicchetti, D. V. (1994). Guidelines, criteria, and rules of thumb for evaluating normed and

standardized assessment instruments in psychology. Psychological assessment, 6(4), 284.

Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 7

Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL

Deckers, L. (2001). Publication manual of the American psychological association. Allyn &

Bacon.

Escurra, L. M. (1988). Cuantificación de la validez de contenido por criterio de jueces. Revista de

Psicología, 6(1-2), 103–111.

Google Drive. (n.d.). Retrieved January 24, 2014, from

http://www.google.com/intl/es/drive/apps.html

LibreOffice. (2014). Retrieved January 25, 2014, from http://es.libreoffice.org/

Licencias - Creative Commons. (2014). Retrieved January 25, 2014, from

http://es.creativecommons.org/blog/licencias/

Penfield, R. D., & Giacobbi Peter R, J. (2004). Applying a score confidence interval to Aiken’s

item content-relevance index. Measurement in Physical Education and Exercise Science,

8(4), 213–225.

Soto, M., & Segovia, L. (2009). Intervalos de confianza asimétricos para el índice la validez de

contenido: Un programa Visual Basic para la V de Aiken, 25(1985), 169–171.

Wilkinson, L. (1999). Statistical methods in psychology journals: guidelines and explanations.

American psychologist, 54(8), 594.

Wilson, E. B. (1927). Probable inference, the law of succession, and statistical inference. Journal

of the American Statistical Association, 22(158), 209–212.

A questionnaire of Pressure Ulcers Prevention Knowledge CPUPP-37: Elaboration and content validation

Article

Full-text available

Mar 2017

Objetivo: Diseñar y validar el contenido de un cuestionario sobre conocimientos en prevención de úlceras por presión (UPP) en adultos, basado en recomendaciones de guías de práctica clínica (GPC) y documentos técnicos dirigidos a enfermeras. Metodología: Estudio descriptivo transversal para la validación de contenido de un cuestionario. Se desarrollaron tres fases: selección de documentos sobre prevención de UPP; extracción de las recomendaciones y redacción de ítems, y validación de contenido mediante consulta a un panel de 12 expertos en UPP. Para el acuerdo se calculó el índice V de Aiken. Resultados: Se localizaron 6 GPC y 1 documento técnico tras la búsqueda en diversas fuentes de datos (N = 15). Se obtuvieron 414 recomendaciones en prevención de UPP para población adulta, de las cuales se extrajeron 84 tras la síntesis y agrupación en áreas. Se escogieron 44 recomendaciones con un porcentaje de acuerdo entre expertos superior al 80% para elaborar la versión inicial del cuestionario (con 52 ítems), y tras dos rondas de valoración por expertos quedaron 37 ítems. Conclusiones: El cuestionario CPUPP-37 explora los conocimientos de las enfermeras sobre prevención de UPP basándose en recomendaciones actuales. Tiene buenos valores de validación de contenido, por lo que puede usarse en estudios posteriores para establecer su fiabilidad y validez.

Diseño y validación de una escala para medir riesgo de caídas en pacientes mayores de 65 años

Article

Apr 2019

Las caídas son la causa predominante de lesiones en personas mayores de 65 años. Durante la hospitalización, las caídas se convierten en uno de los riesgos del paciente, además de las lesiones físicas, suponen la pérdida de confianza en sus propias capacidades, influyendo en las actividades de la vida diaria y por tanto en su calidad de vida. La bibliografía describe una baja sensibilidad de las escalas para la medición del riesgo, obteniendo distintos resultados y dificultades para su uso. Además, se ha demostrado la existencia de otros factores de riesgo como la hiponatremia como una de las causas frecuente de las caídas y que no se mide de manera directa en estas escalas. Las guías de cuidados actuales y las estrategias de seguridad de los servicios sanitarios recomiendan la utilización de escalas para la evaluación del riesgo, pero ninguna de ellas incluye la monitorización de las cifras de sodio sérico. Objetivo: Diseñar y validar un instrumento para identificar el riesgo de caídas en pacientes mayores de 65 años hospitalizados Diseño: Este estudio consta de dos fases metodológicas: el diseño del instrumento (Fase I) y su validación (fase II): validación clinimétrica y una longitudinal de seguimiento prospectivo de la Cohorte de pacientes reclutada. Análisis de datos: Análisis descriptivo y bivariante. Para la validación clinimétrica se realizará un análisis factorial exploratorio y confirmatorio, sobre el modelo inicial de dimensiones de la escala.

Cuantificación de la validez de contenido por criterio de jueces

Article

Full-text available

Dec 1988

Luis Escurra

El presente estudio evalúa tres formas de cuantificar la validez de Contenido por criterio de Jueces: el índice de Acuerdo (IA), la Prueba Binomial (PB) y el coeficiente V de Aiken (V); computados en base a las respuestas posibles asignadas por 10 jueces a un ítem. Los resultados permiten concluir que el coeficiente V de Aiken es el más adecuado para determinar e!te tipo de validez, ya que permite obtener valores factibles de ser contrastados estadística mente según el tamaño de la muestra de jueces seleccionada.

Guidelines, Criteria, and Rules of Thumb for Evaluating Normed and Standardized Assessment Instrument in Psychology

Article

Full-text available

Dec 1994

Domenic Vincent Cicchetti

In the context of the development of prototypic assessment instruments in the areas of cognition, personality, and adaptive functioning, the issues of standardization, norming procedures, and the important psychometrics of test reliability and validity are evaluated critically. Criteria, guidelines, and simple rules of thumb are provided to assist the clinician faced with the challenge of choosing an appropriate test instrument for a given psychological assessment. (PsycINFO Database Record (c) 2012 APA, all rights reserved)

Intervalos de confianza asimétricos para el índice la validez de contenido : un programa Visual Basic para la V de Aiken

Article

Full-text available

El presente artículo presenta un programa informático en el lenguaje Visual Basic para el cálculo del coeficiente V de Aiken, usado para cuantificar la validez de contenido, y su intervalo de confianza en niveles de tasa de error tipo I previamente seleccionados. La construcción de los intervalos de confianza se hizo por la derivación del método score y publicado en Penfield y Giacobbi (2004). El creciente uso de este método y del enfoque de intervalos de confianza se ajusta a las demandas actuales mejoramiento de los resultados estadísticos inferenciales en la investigación psicológica. Se discute su uso en contextos aplicados.

Statistical methods in psychology journals: Guidelines and explanations

Article

Jan 1999
AM PSYCHOL

Content Validity and Reliability of Single Items or Questionnaires

Article

Dec 1980
EDUC PSYCHOL MEAS

Lewis R. Aiken

Procedures for computing content validity (V) and consistency re liability (R) coefficients and determining the statistical significance of these coefficients are described. These procedures, which employ the multinomial probability distribution for small samples and nor mal curve probability estimates for large samples, can be used in a variety of situations where judgments of the content validity of items or questionnaires are made on ordinal rating scales. Computing for mulas for determining the statistical significance of V and R for large samples of raters and any number of rating categories are given. A computer program has been written to determine the right- tail probabilities associated with values of V and R obtained from ratings by N raters using c rating categories.

Probable Inference, the Law of Succession and Statistical Inference

Article

Jan 1927
J AM STAT ASSOC

E.B. Wilson

Applying a Score Confidence Interval to Aiken's Item Content-Relevance Index

Article

Dec 2004
Meas Phys Educ Exerc Sci

Item content-relevance is an important consideration for researchers when developing scales used to measure psychological constructs. Aiken (1980) proposed a statistic, V, that can be used to summarize item content-relevance ratings obtained from a panel of expert judges. This article proposes the application of the Score confidence interval to Aiken's V statistic to improve the inference of the unknown population value of V. The application of the Score confidence interval to V is described, a numerical example is provided, and a demonstration of the Score confidence interval is presented for ratings obtained in the development of a scale measuring life skills.

The American Psychological Association

Article

Mar 1897

Livingston Farrand

Analizando la V de Aiken Usando el Método Score con Hojas de Cálculo

Abstract

Recommended publications

Analyzing V Aiken's Content Validity using Score Method with Spreadsheets.

Analyzing V Aiken's Content Validity using Score Method with Spreadsheets.

Analizando la V de Aiken Usando el Metodo Score con Hojas de Calculo.

Analizando la V de Aiken Usando el Metodo Score con Hojas de Calculo.

Analyzing V Aiken's Content Validity using Score Method with Spreadsheets.