Тест как элемент контроля

Тест как элемент контроля

Тест обученности – это совокупность заданий, ориентированных на определение уровня усвоения определенных аспектов содержания обучения [1].

Важнейшими критериями диагностических тестов обученности являются:

  • Действенность теста: полнота, всесторонность проверки, пропорциональность представления всех элементов изучаемых знаний, умений. В качестве синонима термина «действенность» часто используются понятия валидность, показательность, представительность, репрезентативность. Неотъемлемым условием действенности теста является четкая и ясная постановка вопроса в пределах освоенных знаний. Если тест выходит за пределы освоенного содержания или же не достигает этих пределов, превышает запроектированный уровень обучения, то он не будет действенным для тех обучаемых, которым он адресован.

  • Надежность теста: характеризуется стабильностью, устойчивостью показателей при повторных иfзмерениях с помощью того же теста или его равноценного заменителя. Количественно этот показатель характеризуется вероятностью достижения запроектированных результатов. Надежность теста повышается при увеличении количества тестовых заданий. При этом чем выше тематическое, содержательное разнообразие тестовых заданий, тем ниже надежность теста. Это следует понимать так: тест, нацеленный на проверку усвоения конкретной темы, всегда будет более надежным, чем тест, направленный на проверку всего раздела (курса), охватывающий значительное количество материала – закономерностей, концепций, фактов.

    Надежность тестов обученности значительно зависит от трудности их выполнения, которая в свою очередь определяется соотношением правильных и неправильных ответов на тестовые вопросы. Включение в состав тестов таких заданий, на которые все обучаемые отвечают правильно или же, наоборот, неправильно, резко снижает надежность теста в целом.

  • Дифференцированность теста: способность теста отделить тех, кто усвоил материал на необходимом уровне, от тех, кто заданного уровня не достиг. Для определения дифференцированности теста применяются такие статистические параметры, как индекс дифференциации и коэффициент дифференциации.

При составлении тестов необходимо руководствоваться следующими правилами:

  • однозначность заданий: тестовые задания не должны допускать произвольного толкования;
  • однозначность ответов: должна быть исключена возможность формулирования многозначных ответов;
  • простота восприятия: формулируйте вопросы и варианты ответов лаконично, избегайте двойного отрицания;
  • соответствие изученному: нельзя включать ответы, неправильность которых на момент тестирования не может быть обоснована учащимися;
  • подбор дистракторов: неправильные ответы должны конструироваться на основе типичных ошибок и должны быть правдоподобными;
  • уникальность: вопросы не должны повторять формулировок учебника;
  • закономерности: при подборе вариантов ответа должны отсутствовать закономерности, например, в порядке следования или длине ответа (достаточно часто выделяющийся по длине ответ оказывается правильным).

После того как тест составлен, должна проводиться апробация. На основе статистических параметров определяются задания, которые не являются тестовыми, такие задания должны отбраковываться. Процесс совершенствования теста не должен заканчиваться апробацией. Необходимо постоянно отслеживать качество тестовых заданий, особенное внимание обращая на вновь добавленные. Для анализа тестовых заданий могут использоваться следующие статистические параметры:

  • Среднеквадратичное отклонение (СКО): измеряет разброс баллов, полученных испытуемыми при ответе на конкретное задание теста. Если все пользователи отвечают на вопрос одинаково, то разброс баллов, характеризуемый этим параметром, будет равен нулю (СКО=0). Это свидетельствует о том, что такое задание не является тестовым и, следовательно, должно отбраковываться.
  • Индекс дифференциации (ИД): является грубым индикатором способности конкретного тестового задания отделить более успешных испытуемых от менее успешных. Этот параметр может принимать значения между +1 (все испытуемые из сильной группы ответили правильно, а из слабой – неправильно) и -1 (все испытуемые из сильной группы ответили неправильно, а из слабой, напротив, – правильно). Отрицательные значения индекса свидетельствует о том, что слабые испытуемые отвечают на данный вопрос лучше, чем сильные. Такие тестовые задания должны отбраковываться. Фактически они уменьшают точность всей процедуры тестирования.
  • Коэффициент дифференциации (КД): другой способ измерения способности конкретного задания разделять сильных и слабых испытуемых. Коэффициент дифференциации – это коэффициент корреляции между множеством значений ответов, полученных испытуемыми при выполнении конкретного задания, с результатами выполнения ими теста в целом.

    Этот параметр также может принимать значения между +1 и -1. Положительные значения соответствуют заданиям, которые действительно разделяют хорошо и слабо подготовленных учеников, в то время как отрицательное значение коэффициента свидетельствует о том, что плохо подготовленные ученики отвечают на данное задание в среднем лучше, чем хорошо подготовленные. Такие задания с отрицательным значением коэффициента дифференциации не являются тестовыми, так как не отвечают требованиям задачи тестирования по оценке уровня подготовленности испытуемых. Таких заданий следует избегать.

    Преимущество коэффициента дифференциации по сравнению с индексом дифференциации состоит в том, что первый использует информацию от всей совокупности учеников, а не только критические верхние и нижние трети этой совокупности. Таким образом, этот параметр может быть более чувствителен для того, чтобы обнаруживать эффективность измерительной способности тестовых заданий.

Подробнее об этих параметрах и методике их расчета можно узнать в справке Moodle: Анализ тестовых заданий.

Последнее изменение: Суббота, 13 Август 2011, 10:32