ResearchPDF Available

Analizando la V de Aiken Usando el Método Score con Hojas de Cálculo

Authors:
  • SASEMAR-Spain

Abstract

Despite the widespread use of factor V Aiken to measure interrater agreement when constructing and validating questionnaires, their calculation is not included in statistical packages such as SPSS and tends to compute by hand, which can be cumbersome and leads to errors. Giacobbi and Penfield (2004) proposed an improved Aiken based method using confidence intervals, we thought worth followed, and according to the guidelines of the APA (Deckers, 2001) and Wilkinson (1999) on the quantification of content validity. Using spreadsheets overcomes the limitations associated with the use of MS Windows based platform programs as Soto & Segovia, (2009) , in terms of modifiability and distribution.
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 1
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
Analizando la V de Aiken Usando el Método Score con Hojas de Cálculo.
Analyzing V Aiken's Content Validity using Score Method with Spreadsheets.
José Rodríguez Cordón
Universidad de Cádiz
Keywords: V Aiken; Content Validity; Validity; Score Method; Spreadsheet;excel;calc;psicometry
Palabras clave: Validez de contenido;V de Aiken;intervalos de confianza;psicometría;validez;hoja
de cálculo;excel;calc;score
Dirección de contacto: Para cualquier contacto usar el email josercordon@gmail.com o
joserc@sasemar.es .
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 2
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
Resumen
A pesar de la extensión del uso del coeficiente V de Aiken para medir el acuerdo
interjueces a la hora de construir y validar cuestionarios, su cálculo no está incluido en paquetes
estadisticos como SPSS y se tiende a computar a mano, lo que puede resultar engorroso y enducir
a errores. Penfield y Giacobbi (2004) propusieron una mejora en el Método de Aiken utilizando
intervalos de confianza, que pensamos merece la pena seguirse, según las directrices de la APA
(Deckers, 2001) y de Wilkinson (1999) sobre la cuantificación de la validez de contenido. El uso
de hojas de cálculo supera las limitaciones de utilizar programas ligados a la plataforma MS
Windows como el de Soto & Segovia (2009), en cuanto a modificabilidad y distribución.
Abstract
Despite the widespread use of factor V Aiken to measure interrater agreement when
constructing and validating questionnaires, their calculation is not included in statistical packages
such as SPSS and tends to compute by hand, which can be cumbersome and leads to errors.
Giacobbi and Penfield (2004) proposed an improved Aiken based method using confidence
intervals, we thought worth followed, and according to the guidelines of the APA (Deckers,
2001) and Wilkinson (1999) on the quantification of content validity. Using spreadsheets
overcomes the limitations associated with the use of MS Windows based platform programs as
Soto & Segovia, (2009) , in terms of modifiability and distribution.
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 3
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
Introducción
Una buena parte de los cuestionarios y escalas que se utilizan en la práctica psicológica se
han construido en una primera fase sometiendo los ítems a prueba de jueces, sin embargo los
grandes paquetes estadísticos no proporcionan una manera rápida de realizar esta prueba, por lo
que en la mayoría de las ocasiones se recurre a realizar su cálculo a mano, lo que puede resultar
engorroso y enducir a errores. Por otra parte, la utilización cada vez más extendida de
cuestionarios on-line, cuyos resultados se obtienen automáticamente en formato de hoja de
cálculo -la plataforma de google (“Google Drive,” n.d.)es un buen ejemplo de ello- lleva a la
conclusión inmediata de desarrollar una hoja de cálculo con las fórmulas necesarias para realizar
esta prueba de manera automática y que además proporcione de un vistazo el criterio de decisión
sobre el mantenimiento o rechazo de cada ítem.
Método
Al afrontar la elaboración de escalas para la medición de constructos psicológicos
normalmente el investigador se encuentra con la disyuntiva de utilizar diversas medidas para
evaluar el acuerdo interjueces, tal como se expone en el trabajo de Escurra (1988). Como
sabemos, realmente lo que estamos tratando de evaluar es la validez de contenido, y según Aiken
(1980) la forma por excelencia de hacerlo es mediante el acuerdo entre jueces entendidos en la
materia.
De acuerdo con Escurra (1988), que analiza el uso de la prueba binomial, el coeficiente V
de Aiken (Aiken, 1980), y el índice simple de acuerdo y comparando sus resultados, concluye que
el más pertinente para su utilización es el V, ya que “ya que tiene la facilidad del cómputo del lA
y la posibilidad de la contrastación estadística de la PB” (Escurra, 1988, p.6), descartando
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 4
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
completamente el Índice de Acuerdo, al carecer este índice de significación estadística, lo que
podría significar arbitrariedad (Escurra, 1988).
De cualquier modo, este índice V luego debe ser contrastado con una tabla de valores que
ofrece el criterio de retención o eliminación del ítem en función del número de jueces, en función
de un valor crítico de V=0,5. Para obviar esto, Penfield & Giacobbi Peter R (2004) modificaron
la ecuación de Aikenpara utilizar un método de decisión basado en intervalos de confianza, que
vienen a representar la probabilidad de ocurrencia de un suceso en una población dado un nivel de
confianza determinado por el investigador. Tal como explica Soto en su trabajo, “la justificación
de utilizar intervalos de confianza para la cuantificación de la validez de contenido va de
acuerdo con el actual énfasis de su uso para reportar hallazgos de investigación psicológica”
(APA, 2000; Soto & Segovia, 2009; Wilkinson, 1999).
La fórmula modificada por Penfield y Giacobbi queda de esta manera:
V=̄
Xl
k
(1) siendo
̄
X
la media de las calificaciones de los jueces, l la mínima calificación
de la escala, y k el rango de la escala utilizada.
Para el cálculo de los intervalos de confianza, los autores recurren al método score de
Wilson (1927) el cual no presenta restricciones en cuanto a normalidad de distribución de la
variable, es asimétrico y altamente exacto (Soto & Segovia, 2009).
El límite inferior del intervalo queda definido por la fórmula:
L=2nkV+z2z
4nkV(1V)+ z2
2(nk +z2)
(2) y el superior:
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 5
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
U=2nkV+z2+z
4nkV(1V)+ z2
2(nk +z2)
(3), siendo Z el valor de la distribución normal de
probabilidad, V la de Aiken calculada en la fórmula (1), y n el número de jueces. Mayor
explicación del método se puede encontrar en Soto & Segovia(2009).
Uso de la Hoja de Cálculo
La hoja de cálculo permite simplemente copiar y pegar las celdas obtenidas de los
cuestionarios online o introducidos en ella manualmente, y ofrece estos cálculos de manera
automática, tan sólo se debe elegir el criterio de exclusión de ítems, para ello se ofrecen niveles
liberales V0=0,5 (Cicchetti, 1994) o más restrictivos como V0=0,70 (Charter, 2003) o más aún
como V0=0,80. De igual forma se puede decidir el nivel de confianza del intervalo del desplegable,
existiendo opciones para 90-95-97,5-99 y 99,9%, por simplificación y para evitar que usuarios
inexpertos manipulen esta celda, pero uno con mínima experiencia en hojas de cálculo puede
fácilmente incluir otros niveles.
Se pueden ampliar el número de ítems con tan solo copiar/pegar las celdas necesarias,
completando el proceso con las celdas inferiores donde se realizan los cálculos. El usuario debe
abstenerse de modificar las celdas protegidas o que contengan fórmulas, para no alterar los
cálculos, para ello, las celdas que no deben modificarse se han sombreado en negro. Tampoco se
debe modificar el formato de celdas ya que no aparecerían en rojo los ítems fuera de rango.
Deben completarse también las casillas de mínimo de escala y del rango de valores de la
misma, se ha preferido mantenerlo así en aras de la flexibilidad y dado que en una hoja de cálculo
existe la posibilidad de copiar y pegar, es más sencillo que mediante fórmulas de cálculo
automático.
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 6
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
Del mismo modo que en el programa de Soto & Segovia(2009), pero de un modo muy
visual e interactivo se da la posibilidad al investigador de, mediante la modificación de diversos
parámetros, como la significación o el número de jueces, ajustar su prueba para que cumpla con
los requisitos exigidos al planificar la investigación.
Disponibilidad
La hoja de cálculo está disponible en formatos (“LibreOffice,” 2014) y MS Excel, a
elección del usuario y se distribuye bajo licencia Reconocimiento – NoComercial (by-nc): Se
permite la generación de obras derivadas siempre que no se haga un uso comercial. Tampoco se
puede utilizar la obra original con finalidades comerciales (“Licencias - Creative Commons,”
2014). Cualquier comentario y aportaciones es bienvenido al email del autor.
Pueden ser descargadas desde las url:
https://www.dropbox.com/s/2mfdqqxqyazjbl6/prueba_V.xlsx
https://www.dropbox.com/s/ssyma37ttwduoqn/V_Aiken.ods
Referencias
Aiken, L. R. (1980). Content Validity and Reliability of Single Items or Questionnaires.
Educational and Psychological Measurement, 40(4), 955–959.
doi:10.1177/001316448004000419
APA. (2001). APA Format–6, (2000), 1–4.
Cicchetti, D. V. (1994). Guidelines, criteria, and rules of thumb for evaluating normed and
standardized assessment instruments in psychology. Psychological assessment, 6(4), 284.
Running head: AIKEN VALIDITY USING SCORE METHOD WITH EXCEL 7
Encabezado: V AIKEN USANDO EL MÉTODO SCORE EN EXCEL
Deckers, L. (2001). Publication manual of the American psychological association. Allyn &
Bacon.
Escurra, L. M. (1988). Cuantificación de la validez de contenido por criterio de jueces. Revista de
Psicología, 6(1-2), 103–111.
Google Drive. (n.d.). Retrieved January 24, 2014, from
http://www.google.com/intl/es/drive/apps.html
LibreOffice. (2014). Retrieved January 25, 2014, from http://es.libreoffice.org/
Licencias - Creative Commons. (2014). Retrieved January 25, 2014, from
http://es.creativecommons.org/blog/licencias/
Penfield, R. D., & Giacobbi Peter R, J. (2004). Applying a score confidence interval to Aiken’s
item content-relevance index. Measurement in Physical Education and Exercise Science,
8(4), 213–225.
Soto, M., & Segovia, L. (2009). Intervalos de confianza asimétricos para el índice la validez de
contenido: Un programa Visual Basic para la V de Aiken, 25(1985), 169–171.
Wilkinson, L. (1999). Statistical methods in psychology journals: guidelines and explanations.
American psychologist, 54(8), 594.
Wilson, E. B. (1927). Probable inference, the law of succession, and statistical inference. Journal
of the American Statistical Association, 22(158), 209–212.
... Se les pidió que valoraran los ítems en función de la relevancia (importancia para ser incluido en el cuestionario de conocimientos sobre prevención de UPP) y de la claridad (en cuanto a la redacción de los mismos), usando una escala de 1 a 5, siendo 1 (Nada relevante/Nada claro) y 5 (Muy relevante/Muy claro); en caso de encontrar algún ítem poco claro, se pidió que propusieran una redacción alternativa. Para establecer el grado de acuerdo entre los expertos se calculó el índice V de Aiken, y su intervalo de confianza al 95% (IC95%) mediante el método Score que tiene muy buenas propiedades para el análisis debido a que no depende de la distribución normal de la variable (25,26) . El índice V de Aiken puede tomar valores entre 0 y 1, según menor o mayor grado de acuerdo. ...
... En este punto, aunque existen diferentes métodos para valorar la validez, hemos considerado emplear el método de la V de Aiken como método idóneo debido a la facilidad de cálculo (24) y evaluación de los resultados mediante su IC95% (25) . Hemos empleado para ello el método Score con hojas de cálculo (26) , usando criterios estrictos para elección de los ítems una vez obtenidos los cálculos escogiendo un nivel mínimo de validez de 0,80. ...
Article
Full-text available
Objetivo: Diseñar y validar el contenido de un cuestionario sobre conocimientos en prevención de úlceras por presión (UPP) en adultos, basado en recomendaciones de guías de práctica clínica (GPC) y documentos técnicos dirigidos a enfermeras. Metodología: Estudio descriptivo transversal para la validación de contenido de un cuestionario. Se desarrollaron tres fases: selección de documentos sobre prevención de UPP; extracción de las recomendaciones y redacción de ítems, y validación de contenido mediante consulta a un panel de 12 expertos en UPP. Para el acuerdo se calculó el índice V de Aiken. Resultados: Se localizaron 6 GPC y 1 documento técnico tras la búsqueda en diversas fuentes de datos (N = 15). Se obtuvieron 414 recomendaciones en prevención de UPP para población adulta, de las cuales se extrajeron 84 tras la síntesis y agrupación en áreas. Se escogieron 44 recomendaciones con un porcentaje de acuerdo entre expertos superior al 80% para elaborar la versión inicial del cuestionario (con 52 ítems), y tras dos rondas de valoración por expertos quedaron 37 ítems. Conclusiones: El cuestionario CPUPP-37 explora los conocimientos de las enfermeras sobre prevención de UPP basándose en recomendaciones actuales. Tiene buenos valores de validación de contenido, por lo que puede usarse en estudios posteriores para establecer su fiabilidad y validez.
... Para establecer el grado de acuerdo entre los expertos se calculó el índice V de Aiken, y su intervalo de confianza al 95% (IC95%) mediante el método Score que cuenta con unas propiedades óptimas puesto que no depende de la distribución normal de la variable [18,19]. ...
Article
Las caídas son la causa predominante de lesiones en personas mayores de 65 años. Durante la hospitalización, las caídas se convierten en uno de los riesgos del paciente, además de las lesiones físicas, suponen la pérdida de confianza en sus propias capacidades, influyendo en las actividades de la vida diaria y por tanto en su calidad de vida. La bibliografía describe una baja sensibilidad de las escalas para la medición del riesgo, obteniendo distintos resultados y dificultades para su uso. Además, se ha demostrado la existencia de otros factores de riesgo como la hiponatremia como una de las causas frecuente de las caídas y que no se mide de manera directa en estas escalas. Las guías de cuidados actuales y las estrategias de seguridad de los servicios sanitarios recomiendan la utilización de escalas para la evaluación del riesgo, pero ninguna de ellas incluye la monitorización de las cifras de sodio sérico. Objetivo: Diseñar y validar un instrumento para identificar el riesgo de caídas en pacientes mayores de 65 años hospitalizados Diseño: Este estudio consta de dos fases metodológicas: el diseño del instrumento (Fase I) y su validación (fase II): validación clinimétrica y una longitudinal de seguimiento prospectivo de la Cohorte de pacientes reclutada. Análisis de datos: Análisis descriptivo y bivariante. Para la validación clinimétrica se realizará un análisis factorial exploratorio y confirmatorio, sobre el modelo inicial de dimensiones de la escala.
Article
Full-text available
El presente estudio evalúa tres formas de cuantificar la validez de Contenido por criterio de Jueces: el índice de Acuerdo (IA), la Prueba Binomial (PB) y el coeficiente V de Aiken (V); computados en base a las respuestas posibles asignadas por 10 jueces a un ítem. Los resultados permiten concluir que el coeficiente V de Aiken es el más adecuado para determinar e!te tipo de validez, ya que permite obtener valores factibles de ser contrastados estadística mente según el tamaño de la muestra de jueces seleccionada.
Article
Full-text available
In the context of the development of prototypic assessment instruments in the areas of cognition, personality, and adaptive functioning, the issues of standardization, norming procedures, and the important psychometrics of test reliability and validity are evaluated critically. Criteria, guidelines, and simple rules of thumb are provided to assist the clinician faced with the challenge of choosing an appropriate test instrument for a given psychological assessment. (PsycINFO Database Record (c) 2012 APA, all rights reserved)
Article
Full-text available
El presente artículo presenta un programa informático en el lenguaje Visual Basic para el cálculo del coeficiente V de Aiken, usado para cuantificar la validez de contenido, y su intervalo de confianza en niveles de tasa de error tipo I previamente seleccionados. La construcción de los intervalos de confianza se hizo por la derivación del método score y publicado en Penfield y Giacobbi (2004). El creciente uso de este método y del enfoque de intervalos de confianza se ajusta a las demandas actuales mejoramiento de los resultados estadísticos inferenciales en la investigación psicológica. Se discute su uso en contextos aplicados.
Article
Procedures for computing content validity (V) and consistency re liability (R) coefficients and determining the statistical significance of these coefficients are described. These procedures, which employ the multinomial probability distribution for small samples and nor mal curve probability estimates for large samples, can be used in a variety of situations where judgments of the content validity of items or questionnaires are made on ordinal rating scales. Computing for mulas for determining the statistical significance of V and R for large samples of raters and any number of rating categories are given. A computer program has been written to determine the right- tail probabilities associated with values of V and R obtained from ratings by N raters using c rating categories.
Article
Item content-relevance is an important consideration for researchers when developing scales used to measure psychological constructs. Aiken (1980) proposed a statistic, V, that can be used to summarize item content-relevance ratings obtained from a panel of expert judges. This article proposes the application of the Score confidence interval to Aiken's V statistic to improve the inference of the unknown population value of V. The application of the Score confidence interval to V is described, a numerical example is provided, and a demonstration of the Score confidence interval is presented for ratings obtained in the development of a scale measuring life skills.