UNIDAD DE EVALUACIÓN EDUCATIVA, 
Universidad Autónoma de Baja California
Tel.  
+52(646) 175 07 07
+52(646) 175 07 00
Km. 103 Carretera Tijuana-Ensenada
Ensenada, Baja California,
México C.P. 22830
Glosario
Agregado
La acumulación de datos similares en un conjunto más grande. Por ejemplo, el cómputo de los mismos puntajes en un examen de lectura de varios salones en una inspección escolar.
Alineamiento
Vínculo entre métodos instruccionales, evaluaciones y estándares curriculares.
Análisis de conceptos
Determinación de atributos, extensión y posición jerárquica de un concepto.
Análisis de contenido
Determinación de la modalidad de un contenido y de su correspondiente tratamiento diferencial, según sea un concepto o un procedimiento.
Análisis de procedimientos
Determinación de requisitos teóricos y prácticos, contexto de uso y secuencia de operaciones de un procedimiento.
Aprendizaje
Cambio relativamente permanente en la conducta debido a la experiencia.
Base del reactivo
Enunciado o pregunta que instiga una respuesta del examinado.
Calificación analítica del rasgo
Un procedimiento de la calificación en el que se evalúan de acuerdo a ciertos criterios las ejecuciones en rasgos o dimensiones seleccionadas, en las cuales cada rasgo recibe un puntaje separado. Este método se usa a menudo en la evaluación de muestras de escritura y de otras ejecuciones de examinados.
Calificación holística
Asignación un puntaje global a una ejecución de acuerdo con ciertos criterios.
Calificación por curva
Una práctica común de asignar las calificaciones en base al supuesto de que las frecuencias de respuesta asociadas con el rasgo que se mide tienen una distribución en forma de campana y que debe haber tantos seises como dieces. (ver curva normal).
Características críticas o atributos
Elementos mínimos, necesarios y suficientes que determinan que algo sea lo que es; y que permiten distinguir a un concepto de otros.
Carga académica
Pesos académicos y cargas horarias asociados a los contenidos de un programa de estudios.
Cognición
El resultado psicológico de la percepción, el aprendizaje y el razonamiento.
Conceptos
Clasificaciones de objetos o eventos que abrevian y simplifican la descripción de la realidad.
Confiabilidad
El grado en que los resultados de una evaluación son fidedignos, y estables. La confiabilidad indica la consistencia de los puntajes entre evaluadores, en el tiempo, o en tareas diferentes que miden la misma cosa o dentro de una sola prueba. Así, puede ser de ocasión a ocasión, de juez a juez, de prueba a prueba, de ítem a ítem, etc.
Contenido
De lo que trata una comunicación sobre algo; es decir, la sustancia, asunto, mensaje. También todo lo incluido en una colección (por ejemplo un programa, un curso, etc.).
Contexto de uso de un procedimiento
Situaciones, condiciones, ocasiones, modalidades, espacios, problemáticas, etc. que rodean la operación de un procedimiento y que determinan cuándo, cómo, dónde, etc. es aplicable o no.
Currículum
Curso integrado de estudios académicos.
Curva Normal
Familia de curvas simétricas, en forma de campana, cuya forma se cree que subyace comúnmente a muchos rasgos medidos por las evaluaciones psicológicas. (ver Calificación por curva).
Definición
Enunciado del género próximo de un término y de su diferencia específica. Enunciado de los atributos de un concepto.
Desagregación
Descomposición de datos sumarios en partes constituyentes. Por ejemplo, reportar los puntajes obtenidos en ciencia por una escuela, por género o nivel socioeconómico.
Distractores
Opciones incorrectas que se ofrecen en un reactivo al examinado con el objeto de poner a prueba su dominio de un contenido.
Ejemplos
Casos que contienen los atributos de un concepto
Epistemología
Teoría filosófica del conocimiento. Teoría que explica cómo se conoce la realidad
Especificaciones de reactivos
Descripción técnica de las características relevantes, desde el punto de vista psicométrico y disciplinario, que debe tener un reactivo que será elaborado para una prueba. Retrato hablado de un ítem.
Estándar de ejecución
La descripción de conocimientos y/o habilidades esperados en diferentes niveles de desarrollo a fin de que un estudiante demuestre su dominio del contenido.
Estandarización
Un conjunto de procedimientos consistentes para construir, administrar y calificar una prueba. La meta de la estandarización es asegurar que todos los estudiantes son evaluados bajo condiciones uniformes de modo que la interpretación de su ejecución sea comparable y no influida por condiciones diferentes.
Evaluación alternativa
Cualquier tipo de evaluación en la cual los estudiantes crean una respuesta a una pregunta (opuesto a evaluaciones en las que los estudiantes escogen una respuesta de una lista dada: como la opción múltiple, respuesta alterna o relación de columnas. Las evaluaciones alternativas pueden incluir, entre otras, preguntas de respuesta breve, ensayos, presentaciones orales, demostraciones, exhibiciones y portafolios.
Evaluación auténtica
Tareas de evaluación que dan lugar a demostraciones de conocimientos o habilidades en formas que se parecen a "la vida real" tanto como es posible.
Evaluación de Alto Impacto
Cualquier programa de evaluación cuyos resultados tienen consecuencias importantes para los estudiantes, maestros, y/o directivos escolares. Tales impactos pueden incluir promoción, certificación, graduación, aceptación o rechazo del programa, acceso a recursos, etc.
Evaluación de ejecución
La observación directa de la ejecución o trabajo del estudiante del estudiante y juicio profesional sobre la calidad de esa ejecución. Una evaluación de la ejecución de calidad posee criterios preestablecidos de ejecución.
Evaluación de gran escala
Evaluaciones para los propósitos y audiencias fuera del aula. Normalmente se estandarizan las evaluaciones a gran escala en alguna medida y se aplican al mismo tiempo a grandes números de estudiantes. Los propósitos para la evaluación de gran escala incluyen asumir responsabilidad, evaluación de programas, certificación de competencias y selección de estudiantes para programas especiales. La evaluación de gran escala puede guiar las decisiones instruccionales en el aula, pero normalmente ése no es su propósito primario.
Evaluación Referida a un Criterio
Comparar la actuación de un estudiante con una descripción de la ejecución deseada. Por ejemplo, se esperaría que un estudiante tenga correctos tres de los cuatro ítems que miden un rasgo particular. Este método se contrasta a menudo con la Evaluación Referida a una Norma.
Evaluación Referida a una Norma
Comparar la ejecución de un estudiante o el resultado de una prueba, con aquéllos de otros estudiantes similares. Por ejemplo: un estudiante teclea mejor que el 80% de otros estudiantes examinados. Sin embargo, ello no nos dice qué tan rápido escribe realmente el estudiante. Este tipo de evaluación frecuentemente se contrasta con la Evaluación Referida a un Criterio.
Evaluación
Estimación del valor de algo. Acto de juzgar las evidencias para fundamentar decisiones. Juicio con respecto a la calidad, valor, o mérito de una respuesta, política, programa, producto, o ejecución, basado en criterios establecidos. Las evaluaciones normalmente incluyen fuentes múltiples de información. Los términos "Medición" y "evaluación" son a menudo, incorrectamente, usados de manera intercambiable.
Examen criterial
Instrumento para evaluar el aprendizaje cuyos resultados permiten comparar la ejecución de un examinado contra un criterio de ejecución preestablecido, usualmente el nivel de dominio del curriculum.
Facilidades
Cambios en los procedimientos de evaluación para proporcionar acceso al estudiante a la información e igualdad de oportunidades para demostrar sus conocimientos y habilidades sin afectar la confiabilidad o validez de la evaluación. Por ejemplo, utilizar un escriba para el caso de ciegos o un aparato braille (ver modificaciones).
Guía para calificar
Un Conjunto de criterios establecidos para calificar la ejecución del estudiante en un ítem específico (ver rúbrica).
Instrucciones para responder
Indicaciones que se proporcionan al examinado para orientar su respuesta en uno o más reactivos de la prueba.
Ítem o reactivo
Componente de un examen que explora el dominio que tiene un examinado de un contenido específico. En los ítems de opción múltiple, comúnmente incluye instrucciones para responder, una base, respuesta correcta y distractores, así como información textual, gráfica o tabular de referencia.
Medición
El proceso de cuantificar, describir o recoger información sobre la ejecución, de conformidad con ciertas reglas, criterios o teorías.
Modificaciones
Cambios realizados a los procedimientos de evaluación para permitirle a un estudiante participar, pero que substantivamente alteran la estandarización de la prueba. Por ejemplo, leer los ítems a un estudiante en una prueba de lectura. (Ver facilidades).
Nivel de ejecución
Estándar de logro establecido, calidad de ejecución o grado de dominio.
Nivel de especificidad de la especificación de reactivos
Grado de detalle de la descripción técnica de las características relevantes que debe tener un reactivo que será elaborado para una prueba. Usualmente adopta las designaciones de general (más apropiado para pruebas normativas), intermedio (más apropiado para pruebas criteriales) y específico (empleado solo para propósitos especiales en pruebas criteriales).
Nivel taxonómico de análisis
Nivel de procesamiento cognitivo de un contenido, caracterizado por la descomposición de algo en sus partes.
Nivel taxonómico de aplicación
Nivel de procesamiento cognitivo de un contenido, caracterizado por requerir el uso de la información en un contexto diferente al que se aprendió.
Nivel taxonómico de comprensión
Nivel de procesamiento cognitivo de un contenido, caracterizado por la paráfrasis.
Nivel taxonómico de conocimiento
Nivel de procesamiento cognitivo de un contenido, caracterizado por apelar al recuerdo.
Nivel taxonómico de evaluación
Nivel de procesamiento cognitivo de un contenido, caracterizado por la emisión de juicios de valor.
Nivel taxonómico de síntesis
Nivel de procesamiento cognitivo de un contenido, caracterizado por integrar un todo a partir de sus partes.
Niveles de dominio
Categorías de dominio relativo que ayuda a los maestros, escuelas e inspecciones escolares a determinar "¿qué tan bueno es lo suficientemente bueno? " con respecto a una evaluación dada. Por ejemplo, los cuatro niveles de dominio empleados por el Estado de Colorado en su programa de pruebas son: No satisfactorio, Parcialmente Hábil, Hábil, y Avanzado.
Objetivo
Que no está influido por la emoción, conjetura, o prejuicio; es decir, basado en fenómenos observables, que se presentan objetivamente. Por ejemplo, véase rúbrica. (ver también subjetivo).
Paráfrasis
Refraseo para propósitos de claridad. Decir lo mismo con otras palabras.
Pedagogía
Disciplina de los principios y métodos de la instrucción.
Peso académico
Nivel de desagregación y dosificación de un contenido respecto a otros. Número de subtemas por tema, de temas por unidad, de unidades por curso, de cursos por materia, de materias por área, de áreas por plan de estudios, de subtemas por área, de subtemas por unidad, etc.
Posición jerárquica
Ubicación de un término en una red conceptual constituida por conceptos supraordinados, coordinados y subordinados.
Psicometría
Rama de la psicología que estudia las mediciones psicológicas (de procesos cognitivos, emociones, etc.).
Pseudoejemplos
Casos que presentan algunos atributos de un concepto, pero no todos. Especialmente los conceptos coordinados respecto a un concepto deteminado.
Puntaje crudo
Generalmente, el número de ítems correctos (o total de puntos logrados en un examen).
Puntaje escalar
Derivado de los puntajes crudos (el número total de puntos logrados) para igualar varios modelos o versiones de una prueba.
Puntos de corte
Puntos de división a lo largo de una escala utilizada para establecer niveles de ejecución.
Rango percentil
El porcentaje de estudiantes con calificaciones por debajo de un puntaje crudo o escalar. Por ejemplo, si el 50% de los examinados en una prueba dada están debajo de un cierto punto, ese punto tiene un rango percentil de 50.
Reactivo muestra
Componente de una especificación de reactivos que ilustra la aplicación de los elementos que la integran.
Red conceptual
Estructura de conceptos supraordenados, coordinados y subordinados.
Requisitos teóricos y prácticos
Conjunto de conceptos y habilidades que deben ser dominados previamente por un aprendiz para que pueda aprender un procedimiento.
Respuesta construida
Un tipo de ítem de una prueba que requiere una demostración más completa de habilidades y conocimientos del estudiante de la que se requiere en modos de respuesta tradicionales como la opción múltiple, respuesta alterna o relación de columnas.
Retícula
Modelo grafico que representa un conjunto de contenidos y las relaciones de servicio entre ellos.
Rúbrica
Un conjunto de criterios establecidos para calificar o evaluar la ejecución del estudiante en una tarea evaluativa. Puede utilizarse una sola rúbrica para calificar múltiples tareas similares. Por ejemplo, podría usarse la misma rúbrica para calificar varios experimentos diferentes en ciencia (ver guía para calificar).
Secuencia de operaciones
Conjunto de pasos, fases o etapas de un procedimiento. Puede ser lineal (paso tras paso: a'b'c'…) o ramificada (de la orden lógica: si p, entonces q).
Sinonimia
Relación semántica que sostiene que dos palabras pueden expresar el mismo significado en un contexto determinado.
Subjetivo
Particular a un individuo dado; personal. Por ejemplo, las calificaciones en el aula tienden a otorgarse bajo la discreción del maestro. (ver objetivo).
Tabla de especificaciones del examen
Muestra el conjunto de contenidos que representa el universo de medida y sintetiza, usualmente de manera tabular, el proceso de planeación de una prueba. Indica también el número de especificaciones de ítems, así como el número, orden de presentación y tipo de reactivos, entre otros aspectos del instrumento. De hecho, representa la estructura general del examen.
Taxonomía de Bloom
Sistema para clasificar objetivos educativos relativos a los aspectos intelectuales, emocionales y físicos del comportamiento. En cuanto a los primeros, clasifica los objetivos de aprendizaje en función de las conductas contenidas en ellos, mismas que son consideradas como indicadores de que la información es procesada cognitivamente de manera diferencial. Los niveles de procesamiento cognitivo de información que propone son: conocimiento, comprensión, aplicación, anólisis, síntesis y evaluación.
Transferencia del aprendizaje
La capacidad para aplicar habilidades, procesos, o contenidos, previamente aprendidos, a situaciones nuevas o diferentes.
Validez
Grado en que una prueba mide lo que dice. Por ejemplo, una evaluación válida de la solución de un problema matemático, mediría la habilidad de los estudiantes para resolver un problema, no la habilidad para leer y comprender el problema. Técnicamente, se refiere a la obtención de evidencias que soportan las inferencias basadas en los puntajes obtenidos en el test. Es el indicador más importante de la calidad de un examen.