концепция тестирования эффективности обучения основана на предположении что испытания должны быть
Концепции тестирования и измерения
Существует множество важных концепций тестирования, и мы будем их приводить в ходе обсуждения оценки персонологами тех или иных характеристик людей. До того, как тот или иной способ тестирования получит право считаться научно приемлемым методом измерения индивидуальных различий, он должен пройти проверку по четырем специальным критериям. Эти критерии — стандартизация, нормы, надежность и валидность.
Стандартизация.Ключевым аспектом измерения личностных характеристик является стандартизация.Стандартизация подразумевает единообразие процедур проведения теста и подсчета результатов. Например, в случае применения шкал самооценки экспериментатор должен приложить максимальные усилия и убедиться, что все испытуемые читают и понимают отпечатанные инструкции, все отвечают на одни и те же вопросы, а также укладываются в заданные временные интервалы. Стандартизация также предполагает наличие следующей информации (обычно содержащейся в прилагаемом руководстве): при каких условиях тест можно или нельзя проводить, кто должен или не должен подвергаться тестированию (контрольная группа), процедуры обсчета теста, а также интерпретация полученных результатов.
Нормы.Стандартизация личностного теста включает также информацию о том, является ли данная конкретная «сырая (первичная) оценка» низкой, высокой или средней относительно других «сырых оценок» теста. Такая информация, называемая тестовыми нормами, служит стандартом, с которым сравниваются оценки испытуемых. Обычно сырые тестовые оценки переводятся в процентильные показатели, которые обозначают процентную долю испытуемых из выборки стандартизации, первичная оценка которых ниже или равна первичной оценке данного испытуемого. Например, вы можете использовать шкалу депрессии из тридцати вопросов и получить первичный тестовый результат 18 (то есть ваши ответы в 18 случаях совпали с признаками депрессии, перечисленными на листке с правильными ответами). Сам по себе показатель 18 ничего не значит до тех пор, пока вы не обратитесь к тестовым нормам и не убедитесь, что ваш результат соответствует 75 процентилям. Эта информация говорит о том, что вы в большей степени подавлены, чем 75 % из выборки ранее обследованных людей, образующих нормативную группу. Таким образом, тестовые нормы позволяют сравнивать оценки отдельных индивидуумов с оценками группы стандартизации, что в результате дает количественную оценку положения испытуемого относительно нормативной группы.
Надежность.Другое требование ко всем методам оценки личности заключается в том, что они должны быть надежными.Это означает, что повторное проведение того же самого теста или другой формы этого теста должно давать приемлемо сходные результаты или оценки. Таким образом, надежность имеет отношение к постоянству или стабильности метода оценки, которая обнаруживается при повторном обследовании данной группы людей. Количественно постоянство метода оценки определяется коэффициентом ретестовой надежности (Anastasi, 1988). Коэффициент ретестовой надежности равен обычной корреляции между результатами, полученными на одних и тех же испытуемых в каждом из двух случаев проведения теста. Ретестовая надежность дает нам оценку постоянства теста во времени. Хотя не существует каких-либо фиксированных величин приемлемого уровня надежности, коэффициенты надежности для большинства стандартизованных психологических тестов выше +0,70. Чем ближе величина коэффициента надежности к +1, тем более надежным является тест (то есть оценки испытуемых при повторном тестировании вплотную приближаются к оценкам при первом тестировании). Второй вид надежности определяют путем коррелирования параллельных форм теста. Для этого чаще всего тест делят на две сопоставимые части (например, на четные и нечетные пункты), потом по каждой половине рассчитывают суммарные баллы и между двумя рядами баллов по испытуемым рассчитывают допустимые коэффициенты корреляции. Полученный таким образом коэффициент называют коэффициентом внутренней согласованности.Внутренняя согласованность отражает внутреннее постоянство теста. Если обе части теста измеряют одно и то же свойство личности, то испытуемые, получившие высокие оценки по нечетным пунктам, должны также получить высокие оценки и по четным; а те, кто получил низкие оценки по нечетным пунктам, должны получить низкие оценки и по четным пунктам (что снова выразится в высокой положительной корреляции).
Третий тип надежности основывается на корреляции между двумя сопоставимыми вариантами одного и того же теста (состоящими из аналогичных вопросов), проведенного на одной и той же группе испытуемых. Если по этим разным формам теста получены примерно одинаковые оценки, тест обладает надежностью параллельных форм.В таком случае положительная корреляция между двумя взаимозаменяемыми формами будет означать, что пункты обоих вариантов теста измеряют одно и то же.
Наконец, надежность также касается того, насколько будут согласны между собой двое или более экспертов при подсчете результатов одного и того же теста. Этот тип надежности называется надежностью субъективных оценок.Надежность субъективных оценок должна обязательно учитываться, если тест предполагает субъективные интерпретации, подобные тем, что дают персонологи при оценке результатов проективных тестов. Этот тип надежности имеет особенно низкие значения в отношении любых качественных методов, таких как интервью, анализ сновидений и других форм свободных ответов, не поддающихся количественной оценке. Однако согласованность возрастает, когда эксперты пользуются руководствами, содержащими четкие правила оценки и инструкции для анализа подобных данных (Yin, 1984).
Валидность.Хотя надежность имеет очень большое значение, она, тем не менее, не является единственным решающим критерием оценки пригодности теста. Возможно, даже более важным является вопрос о том, измеряет ли тест именно то, что он предназначен измерять, а также предсказывает ли он именно то, что предполагалось предсказывать с его помощью. Эта проблема имеет отношение к кардинальному критерию достоинства оценочной техники — валидности.Психологи часто различают три типа валидности: 1) содержательная валидность, 2) критериальная валидность и 3) конструктная валидность.
Содержательная валидность. Чтобы считаться валидным, метод оценки должен включать такие пункты, содержание которых соответствует репрезентативной выборке измеряемой области поведения. Предположим, перед нами тест, измеряющий застенчивость. Для того чтобы быть валидным по содержанию, он должен состоять из вопросов, которые действительно раскрывают личностные аспекты застенчивости (например, «Является ли застенчивость основным источником вашего личностного дискомфорта?»), социальные аспекты застенчивости (например, «Смущаетесь ли вы, когда выступаете перед большой аудиторией?») и когнитивные аспекты (например, «Убеждены ли вы в том, что окружающие всегда осуждают вас?»). Валидный по содержанию тест застенчивости должен оценивать каждый из компонентов, входящих в понятие «застенчивость». Содержательная валидность почти всегда определяется путем соглашения экспертов о том, что каждый пункт теста фактически отражает аспекты переменной, или личностного качества, подлежащие измерению.
Критериальная валидность. Оценка личности обычно предпринимается с целью прогнозирования определенных аспектов поведения индивидуума. Предсказание поведения может касаться успешности обучения в аспирантуре, адекватности терапевтической программы, профессиональной успешности и многого другого, за очень небольшими исключениями. То, с какой точностью результаты теста предсказывают интересующий нас аспект поведения индивида в настоящем или будущем, определяется корреляцией оценок субъектов по данному тесту и показателей по некоему критерию, не зависящему от того, что должен предсказать тест. Например, предположим, что критерий — успеваемость в школе права — измеряется по среднему баллу успеваемости, тогда SAT будет считаться валидным, если он будет точно предсказывать средний балл успеваемости.
Различают два подтипа критериальной валидности. Первый получил название прогностическая валидность.Прогностическая валидность определяется способностью теста предсказывать поведение в будущем, соответственно критерию. Тест измерения интеллекта прогностически валиден, если он точно предсказывает оценки в школе. Второй подтип имеет название текущая валидность. Текущая валидность определяется величиной значимой корреляции результатов данного теста с другими имеющимися критериальными оценками. Например, если оценки пациента по тесту, измеряющему параноидные тенденции, положительно коррелируют с оценками выраженности параноидных тенденций, данными клиническими психологами, то мы можем говорить о наличии текущей валидности. Конечно, клиницисты в этом случае не должны знать заранее о результатах тестирования. Иначе имеющаяся у них информация может повлиять на оценки, которые они дают — это явление называется контаминацией критерия.
Конструктная валидность. Третий тип валидности, один из наиболее важных для оценки личности как целого, называется конструктная валидность. Она отражает степень репрезентации исследуемого психологического конструкта в результатах теста (Cronbach, Meehl, 1955). Абстрактная природа многих психологических конструктов — таких как самоактуализация, эго-идентичность, социальный интерес и вытеснение — усложняет тестирование и придает результатам неопределенность. Попросту говоря, для этих и других абстрактных концепций функционирования личности (или того, что мы иначе называем гипотетическими конструктами)не существует твердо установленных критериальных величин. Хотя иногда можно наблюдать примеры вытеснения, само вытеснение недоступно прямому наблюдению, оно не имеет физических проявлений. Далее, гипотетический конструкт, существование которого невозможно доказать на основании какого-либо поведенческого критерия, для психологии личности бесполезен, поскольку она использует для получения знаний эмпирический подход. Именно здесь и встает вопрос о конструктной валидности.
Конструктная валидизация — это процесс сбора доказательств того, что тест измеряет определенный гипотетический конструкт, выведенный из теории. Это сложный и трудоемкий процесс, требующий проведения многих исследований, в ходе которых подвергаются проверке корреляции между тестовыми оценками и теми величинами, которые предположительно связаны с рассматриваемой концепцией. Один путь валидизации заключается в установлении корреляций между тестовыми оценками исследуемого конструкта и показателями другого теста, который предположительно измеряет тот же самый конструкт. Эта процедура на практике известна как конвергентная валидизация (Campbell, Fiske, 1959). Предположим, перед нами новый тест, который, как мы думаем, измеряет конструкт самооценки. Если этот наш новый тест на самом деле измеряет самооценку, он должен положительно коррелировать с другой процедурой измерения самооценки, хорошо зарекомендовавшей себя и валидной. Если несколько разных измерений самооценки согласуются друг с другом и с нашим новым тестом, мы имеем некоторые доказательства конструктной валидности нашего нового теста самооценки.
Другой путь установления конструктной валидности — показать, что вновь разработанная измерительная процедура не коррелирует с показателями, для измерения которых данная процедура не предназначена, явно не связанными с концептуальным определением, данным теоретиком. Этот аспект валидизации известен на практике под рабочим названием дивергентная валидность (Campbell, Fiske, 1959). Например, если наш новый тест самооценки не коррелирует со значениями других тестов, разработанных для измерения концептуально отличных от представленных в нем качеств, мы получаем доказательства дискриминантной валидности (поскольку наша процедура измерения самооценки отличается от тех, что измеряют не самооценку, а нечто другое, так и должно быть). Это важный этап установления конструктной валидности оценочной процедуры.
Перечисление трудностей, сопряженных с демонстрацией конструктной валидности методов оценки, выходит далеко за пределы темы данной книги. Однако, поскольку мы сейчас рассматриваем различные типы подходов к оценке личности, мы должны помнить, что достоинство любого метода оценки определяется в конце концов его конструктной валидностью. Если данная методика содержит признаки слабой конструктной валидности, то в процессе ее использования мы можем получить результаты, не имеющие ничего общего с проверяемой концепцией.
Концепция тестирования как способ обеспечения качества информационных систем
В данной работе рассматриваются вопросы, связанные с тестированием программного обеспечениия, место и роль тестирование в процессе разработки ПО. Материал полезен для проведения занятий по дисциплине МДК.05.03.»Тестирование информационных систем»
Просмотр содержимого документа
«Концепция тестирования как способ обеспечения качества информационных систем»
Концепция тестирования. Тестирование как способ обеспечения качества информационных систем. Основные понятия тестирования.
Концепция тестирования или Что такое тестирование и откуда оно появилось
Тестирование программного обеспечения — процесс анализа программного средства и сопутствующей документации с целью выявления дефектов и повышения качества продукта.
На протяжении десятилетий развития разработки ПО к вопросам тестирования и обеспечения качества подходили по-разному. Можно выделить несколько основных «эпох тестирования».
В 50–60-х годах прошлого века процесс тестирования был предельно формализован, отделён от процесса непосредственной разработки ПО. Фактически тестирование представляло собой скорее отладку программ (debugging3 ). Существовала концепция «исчерпывающего тестирования» — проверки всех возможных путей выполнения кода со всеми возможными входными данными. Но очень скоро было выяснено, что исчерпывающее тестирование невозможно, т.к. количество возможных путей и входных данных очень велико, а также при таком подходе сложно найти проблемы в документации.
В 70-х годах появились два направления тестирования: тестирование сначала рассматривалось как процесс доказательства работоспособности программы в некоторых заданных условиях, а затем — строго наоборот: как процесс доказательства неработоспособности программы в некоторых заданных условиях. Это внутреннее противоречие не только не исчезло со временем, но и в наши дни используются как две взаимодополняющие цели тестирования.
Самое важное, что тестирование «приобрело» в 70-е годы:
В 80-х годах произошло ключевое изменение места тестирования в разработке ПО: вместо одной из финальных стадий создания проекта тестирование стало применяться на протяжении всего цикла разработки ПО.
Это позволило не только быстро обнаруживать и устранять проблемы, но даже предсказывать и предотвращать их появление. В этот же период времени отмечено бурное развитие и формализация методологий тестирования и появление первых элементарных попыток автоматизировать тестирование. В 90-х годах произошёл переход от тестирования как такового к более всеобъемлющему процессу, который называется «обеспечение качества», охватывает весь цикл разработки ПО и затрагивает процессы планирования, проектирования, создания и выполнения тест-кейсов, поддержку имеющихся тест-кейсов и тестовых окружений.
Тестирование вышло на качественно новый уровень, который привёл к дальнейшему развитию методологий, появлению достаточно мощных инструментов управления процессом тестирования и инструментальных средств автоматизации тестирования, похожих на современные средства.
В нулевые годы этого века развитие тестирования продолжалось в контексте поиска всё новых и новых путей, методологий, техник и подходов к обеспечению качества. Серьёзное влияние на понимание тестирования оказало появление гибких методологий разработки и таких подходов, как «разработка под управлением тестированием».
Автоматизация тестирования уже воспринималась как неотъемлемая часть большинства проектов.
Стали популярны идеи о том, в процессе тестирования следует ставить не соответствие программы требованиям, а её способность предоставить конечному пользователю возможность эффективно решать свои задачи.
Для современного этапа развития тестирования характерно следующее:
Понятие «Тестирование Информационных систем»
Качество программного продукта характеризуется набором свойств, определяющих, насколько продукт «хорош» для заинтересованных сторон, таких как заказчик продукта, спонсор, конечный пользователь, разработчики и тестировщики продукта, инженеры поддержки, сотрудники отделов маркетинга, обучения и продаж. Каждый из участников может иметь различное представление о продукте и том, насколько он хорош или плох, то есть о том, насколько высоко качество продукта. Таким образом, постановка задачи обеспечения качества продукта выливается в задачу определения заинтересованных лиц, их критериев качества и затем нахождения оптимального решения, удовлетворяющего этим критериям. Тестирование является одним из способов обеспечения качества разработки программного обеспечения и входит в набор эффективных средств современной системы обеспечения качества программного продукта.
С технической точки зрения тестирование заключается в выполнении приложения на некотором множестве исходных данных и сверке получаемых результатов с заранее известными (эталонными) с целью установить соответствие различных свойств и характеристик приложения заказанным свойствам.
Программа – это аналог обычной формулы в математике.
Существует два метода обоснования истинности формул:
Формальный подход или доказательство применяется, когда из исходных формул-аксиом с помощью формальных процедур (правил вывода) выводятся искомые формулы и утверждения (теоремы). Вывод осуществляется путем перехода от одних формул к другим по строгим правилам, которые позволяют свести процедуру перехода от формулы к формуле к последовательности текстовых подстановок. Преимущество формального подхода в том, что с его помощью удается избегать обращений к бесконечной области значений и на каждом шаге доказательства оперировать только конечным множеством символов.
Интерпретационный подход применяется, когда осуществляется подстановка констант в формулы, а затем интерпретация формул, как осмысленных утверждений в элементах множеств конкретных значений. Истинность интерпретируемых формул проверяется на конечных множествах возможных значений. Сложность подхода состоит в том, что на конечных множествах комбинации возможных значений для реализации исчерпывающей проверки могут оказаться достаточно велики.
Интерпретационный подход используется при экспериментальной проверке соответствия программы своей спецификации.
Применение интерпретационного подхода в форме экспериментов над исполняемой программой составляет суть отладки и тестирования.
Отладка(debug, debugging) – процесс поиска, локализации и исправления ошибок в программе.
Термин « отладка » в отечественной литературе используется двояко: для обозначения активности по поиску ошибок, по нахождению причин их появления и исправлению, или активности по локализации и исправлению ошибок.
Тестирование – это процесс выполнения ПО системы или компонента в условиях анализа или записи получаемых результатов с целью проверки (оценки) некоторых свойств тестируемого объекта.
Тестирование – это процесс анализа пункта требований к ПО с целью фиксации различий между существующим состоянием ПО и требуемым (что свидетельствует о проявлении ошибки) при экспериментальной проверке соответствующего пункта требований.
Тестирование обеспечивает выявление наличия фактов расхождений с требованиями (ошибок).
Тестирование разделяют на статическое и динамическое :
Статическое тестирование выявляет формальными методами анализа без выполнения тестируемой программы неверные конструкции или неверные отношения объектов программы (ошибки формального задания) с помощью специальных инструментов контроля кода – CodeChecker.
Динамическое тестирование (собственно тестирование ) осуществляет выявление ошибок только на выполняющейся программе с помощью специальных инструментов автоматизации тестирования – Testbed или Testbench.
Последовательность действий при тестировании
Для программы, вычисляющей степень числа, воспроизведем последовательность действий, необходимых для тестирования .
=i;i++) < z = z*x; >return z; > » width=»640″
Концептуальные основы педагогического тестирования и его использование на уроках РКИ
Рубрика: 12. Технические средства обучения
Статья просмотрена: 1131 раз
Библиографическое описание:
Бодрова, Т. Ю. Концептуальные основы педагогического тестирования и его использование на уроках РКИ / Т. Ю. Бодрова. — Текст : непосредственный // Актуальные вопросы современной педагогики : материалы II Междунар. науч. конф. (г. Уфа, июль 2012 г.). — Уфа : Лето, 2012. — URL: https://moluch.ru/conf/ped/archive/60/2500/ (дата обращения: 19.11.2021).
Как отмечено рядом авторов (В.С. Аванесов, М.Б. Челышкова, Г.С. Ковалева, А.И. Субеттто и др.), тесты представляют собой дидактически и технологически эффективное средство объективного контроля подготовленности, позволяя сократить общее время контроля, сохраняя при этом необходимую надежность оценки уровня владения навыком.
Основной характеристикой теста является наличие специфического измерительного инструментария, позволяющего объективно оценить особенности испытуемого. Тест считается средством для проведения научного эксперимента с соответствующими требованиями:
ограничение времени тестирования приблизительно одним часом;
четкое понимание испытуемыми, что нужно делать;
компьютерная программа, располагающая людей к тестированию.
Качественный скачок в развитии тестологии связан с деятельностью французского психолога А. Бине, исследования которого касались определения уровня интеллекта. Наибольшее распространение его система получила в Италии, Великобритании, США.
Дальнейшее развитие данного направления в основном определялось нуждами практики: разрабатывались тесты для профессионального отбора в различных сферах производительной деятельности.
Это вызвано теми изменениями в обществе, которые произошли за последние годы. Новые социальные условия обусловили потребности общества в получении независимой, объективной информации о качестве получаемого и предоставляемого образования.
Сами обучаемые предпочитают тестирование другим методам контроля, считая его наиболее эффективным. Тесты нецелесообразно применять для проверки сформированности умений обобщать, сравнивать, делать выводы, объяснять факты и явления на основе изученных теорий и законов, т.к. обучаемый должен высказать свое личное мнение. Тесты лучше всего использовать в устном опросе на зачете или в письменной контрольной работе.
В странах Запада активное развитие тестологии продолжалось с 30-х-до конца 70-х гг. XX века. Особым путем шло проникновение тестов в Россию.
Долгое время тесты были полностью исключены из учебного процесса. Истоки такой ситуации относятся к началу 30-х годов. Классические тесты возникли позже того времени, когда уже сформировалась первая педагогическая система Коменского, Ушинского, Герберта, Дистерверга, Песталоцци и других, в которых тестирование не предусматривалась.
В СССР к этому времени уже успела сложиться своя педагогическая система, целью которой было воспитание молодежи в духе преданности определенной идеологии, и развивалась так называемая традиционная практика обучения, которая препятствовала развитию объективного контроля знаний.
До 1917 года вопросам тестирования уделялось недостаточное внимание, после 1925 года, когда была создана особая тестовая комиссия, тесты получили практическое применение. К разработанным тестам прилагались инструкции и личная карточка для учета прогресса учащегося. В 1936 году метод тестов был признан буржуазным орудием дискриминации учащихся и «изгнан» из советской школы. Ситуация запрета на тесты не позволяла публиковать что-либо по этому направлению в течение примерно сорока лет.
В педагогике долгое время тест не считался методом педагогического исследования, а поэтому педология и тестология не могли развиваться ни как самостоятельные науки, ни как ее прикладные направления.
К причинам негативного отношения к тестовому контролю можно отнести и стереотип сознания рядового преподавателя о беспроблемности и обманчивой простоте процесса оценивания знаний, умений и навыков.
Только с 60-х годов стали осуществляться серьезные попытки использования зарубежных тестов. Современное содержание тестологии – измерение учебных достижений и анализ результатов в различных областях человеческой деятельности.
В российской педагогике эти идеи только начинают находить свое отражение в теории и практике.
При всей важности многих методик развития учащихся основным все же является направление, связанное с учебной деятельностью в общеобразовательном учреждении, и важно, чтобы эта деятельность строилась на основе реформирования содержания учебных программ и дисциплин, компьютерной поддержки, личностно-ориентированных психолого-педагогических технологиях, новых функциях учителя и учебника в обучении, увеличении доли учебного времени на самостоятельную работу.
Стимулирование и корректировка деятельности, как ученика, так и учителя невозможны без надежных, объективных и независимых оценок результатов. Отсутствие адекватных методов оценки учебных достижений приводит к необоснованным и необъективным действиям, как на уровне учителя, так и школы, управлений, вузов и др.
Сложность оценивания сегодня усугубляется еще и тем, что изменяется само положение педагога в системе образования. В обучении все больше возникает потребность реализовывать субъектно-субъектный подход во взаимодействии учителя и ученика. При этом все больше меняется роль учителя: от трансляции знаний и способов их применения учитель должен переходить к способам интеллектуального и личностного развития каждого учащегося, оказывать содействие формированию широкого спектра компетенций. Учитель все больше должен будет переходить от роли эксперта, предоставляющего информацию, выстраивающего учебный процесс и направляющего учащихся на решение задачи, к роли наставника, организующего процесс обмена информацией, помогающего учащимся выбирать индивидуальный маршрут обучения. Этим процесс обучения отличается от процесса научения. Особенностью такого метода является обучение, основанное на собственном опыте обучающегося.
С начала XX века определилось и педагогическое направление в развитии тестологии.
Объективная, всеохватывающая, научно обоснованная, структурно-организационная диагностика средствами тестирования не только усвоенных знаний, преобразованных в практические навыки и умения, но и латентных процессов умственной деятельности обучаемых может сегодня служить достаточно надежным индикатором качества образования.
Выявление определенного уровня качества знаний по единой шкале оценок обеспечивает понимание учащимся (педагогом, руководством школы и т.д.) действительного своего места, степени подготовленности к деятельности, направлений развития. Для каждого учащегося это еще и преодоление некоторого жизненно важного барьера, самоутверждение, самовыражение, выход за пределы образовательного пространства школы.
С помощью тестирования сегодня удается определять знания, умения, навыки; структуру знаний, умений и навыков; уровень развития интеллекта; выявлять способности в определенных предметных областях. Однако тесты учебных достижений не могут измерить и оценить такие критерии образованности, как компетенции, таланты или творчество.
Критики тестов учебных достижений правы в том, что тесты не все могут измерить, что их применение ограничено.
Традиционные тесты (тесты учебных достижений) не позволяют прогнозировать профессиональный успех, оставляют ценности обследуемого человека скрытыми, не обнаруживают настойчивости, добросовестности, исполнительной дисциплины, организованности и убежденности, что относится не к оценке знаний, а к психологической структуре деятельности мозга.
Тестов в образовании должно быть много – для разных целей и задач тестирования, дифференцирующей способности, видов и объемов контролируемых учебных материалов, глубин знаний, оценок навыков и умений, одаренности и творческой предрасположенности, интеллектуальной развитости и т.д. В этом направлении разработчикам тестов еще предстоит сделать многое.
Судить о достоинствах и возможностях тестов можно по тому, насколько они помогают людям развиваться, выявлять свои таланты, получать признание, способствуют возникновению новых взглядов на проблемы образования, помогают понять преимущества и недостатки конкретных программ обучения, ориентируют учителя в направлении совершенствования педагогического процесса, помогают выявлять способных и талантливых учеников и развивать их способности.
Разумеется, не следует забывать и о том, что тестирование является только составной частью всего образовательного процесса и лишь одной из форм оценки его результатов. Следует внедрять тестовые методы контроля и оценки знаний, так как именно эта проблема в российском образовании долго оставалась открытой, и сегодня ее решение является наиболее востребованной.
За последние годы тестовые методы контроля знаний, умений и навыков учащихся, в том числе и независимые, получают все большее признание как среди учителей и администрации общеобразовательных учреждений, так и среди самих учащихся.
Для понимания сущности современных тестовых методов и технологий проверки знаний, оценки уровня обученности испытуемых и контроля образовательного процесса важно знание определений не только педагогического теста, но и других понятий, связанных с тестированием.
В теории педагогических измерений имеется множество определений ее центрального понятия – «педагогического теста». В переводе с английского « test » – проверка, проба. В значительной степени приемлемыми можно считать определения, которые позволяют понять методологическое обоснование использования тестового контроля, и трактовать педагогический тест как средство измерения знаний, представляющее собой стандартизированную систему заданий специфической формы, позволяющее надежно и объективно оценить уровень усвоения знаний, сформированности умений и навыков (уровень обученности) испытуемых и выразить результат в числовом эквиваленте.
Информационный взрыв» все больше приводит к ситуации, когда преподаватель уже не является основным носителем информации и новейших знаний. Эта роль отводится компьютерным системам, интеграция которых в мировую глобальную компьютерную сеть открывает принципиально новые перспективы и возможности для учебной и творческой деятельности. Без всякого преувеличения можно сказать, что человечество находится на пороге эры информационного образования, где роль учителя меняется от накопления и распространения научной информации к управлению познавательной активностью учащихся и объективному контролю ее результатов.
Особенность современной образовательной ситуации заключается в том, что идет поиск оптимального сочетания различных подходов к развитию образования, оценке его качества, построению новых методологических и методических основ.
Таким образом, тест рассматривается не как произвольный набор заданий, а как система заданий специфической формы, наилучшего состава тестовых заданий разной трудности, позволяющих решать проблему объективизации педагогических измерений; тест является не простым средством проверки, а качественным средством педагогического измерения. Это определение указывает на существенное отличие теста как педагогического измерителя от теста как набора контрольных заданий (классического теста). В профессионально созданном педагогическом тесте система заданий организуется таким образом, чтобы максимально сократить ошибочность оценивания истинного знания для каждого испытуемого, объективно давать достоверные сведения об уровне подготовки испытуемых в соответствии с едиными требованиями, а также исключить влияние субъективного фактора. В современном понимании тест предусматривает также научно обоснованную процедуру, позволяющую выявить интересующие качества объекта реально.
П едагогический тест – это система тестовых заданий, методов их предъявления и оценивания результатов их выполнения, которая обеспечивает получение наиболее обоснованных характеристик объекта испытания.
Одной из важнейших составляющих теста является его тестологическая характеристика, без которой теста не может быть. Под тестологической характеристикой понимаются измерительные качества теста. Обязательной составляющей теста является его спецификация: цель тестирования, сроки его проведения, время работы над тестом, количество и тип используемых заданий, содержательная структура теста, статистические данные апробации, система оценивания результатов тестирования на переменной шкале уровня знаний (на метрической шкале).
После выделения единиц контролируемого материала формулируются задания в тестовой форме.
Правильная форма заданий выступает как средство упорядочения и эффективной организации содержания теста. Она позволяет точно выразить содержание учебной дисциплины (проводится посредством выделения укрупненных единиц знаний), понятна для всех испытуемых, исключает возможность появления ошибочных ответов по формальным признакам. Принципы отображения содержания учебной дисциплины в заданиях теста: значимость, оптимальность, научная достоверность, возрастание трудности заданий, комплексность и сбалансированность, взаимосвязь формы и содержания, соответствие современному состоянию науки.
Педагогическое задание является единицей контролируемого материала. Чтобы оценить уровень подготовки учащихся в соответствии со всем перечнем требований учебной дисциплины, в тесте используются задания разных видов: с выбором ответа, с кратким ответом и с полным ответом, при этом каждое задание выверяется по таким параметрам, как контролируемый элемент содержания (с учетом требований стандарта), базовость, значимость, время выполнения, трудность, дифференцирующая способность и др.
Важной характеристикой теста является его целостность – устойчивое взаимодействие заданий как наилучшего состава тестовых заданий, обеспечивающих объективность контроля знаний испытуемых. Основной составляющей теста является задание с набором характеристик и показателей качества.
Для возможно более точного оценивания большого числа тестируемых (при массовых тестированиях), сопоставимости и достаточной дифференцируемости результатов тестирования в качестве системообразующего фактора, от которого существенно зависит качество результатов, выступает время работы с тестом. Оптимальное время тестирования определяется эмпирически (исходя из удобства тестирования и естественных возможностей непрерывной работы тестируемых) и указывается для каждого теста.
Трудность теста характеризуется суммарной трудностью всех его заданий, при этом последние не могут все быть одинаковы по трудности, так как по определению педагогического теста они должны быть в гомогенном тесте нарастающей трудности.
Испытуемые среднего уровня подготовленности должны ответить верно примерно на половину заданий теста, на задания самого высокого уровня трудности правильно ответить должны только самые подготовленные.
В последние годы получили распространение педагогические измерители – тесты, построенные по математическим моделям в соответствии с поставленными задачами измерения знаний, прошедшие паспортизацию на соответствие целям и по указанным выборкам имеющие соответствующие статистические характеристики, и не так давно в тезаурус тестирования вошло понятие «контрольно-измерительные материалы» (КИМ). Данный вид тестирования должен состоять из: инструкции по процедуре тестирования, бланков ответов, технологии обработки результатов и методики шкалирования.
Тестовые задания объединяются в банк тестовых заданий – совокупность заданий определенной трудности и дифференцирующей способности, выявленных в процессе апробации, параметризации и использования тестовых заданий при массовых тестированиях. Соответственно вводится и определение банка тестов как большого числа паспортизированных тестов, обеспечивающих педагогические измерения в соответствии с поставленными целями (банк стандартизированных педагогических измерителей, или КИМ).
Следует сказать, что педагогические тесты делятся на нормативно-ориентированные и критериально-ориентированные.
Нормативно-ориентированный тест представляет собой метод и средство диагностики испытуемых. Все тестируемые отвечают на одинаковые задания, за одинаковое время, в одинаковых условиях, оцениваются на одной шкале оценок. Такой метод позволяет распределить тестируемых по местам или рейтингу, а цель достигается при сравнительно малом числе заданий в тесте. Интерпретация результатов проводится преимущественно с опорой на среднюю арифметическую оценку или рейтинг, когда каждый знает, сколько процентов испытуемых имеют тестовый результат хуже или лучше его.
Критериально-ориентированные тесты предназначены для решения конкретных целей и задач, например для проверки уровня усвоения определенного перечня знаний, умений и навыков; аттестации выпускников на достижение ими минимально допустимого уровня компетентности. В данном случае вывод строится по логической цепочке: задания – ответы – выводы о соответствии испытуемого заданным критериям.
Критериально – ориентированные педагогические тесты можно использовать как средство проверки знаний не только на занятиях со студентами – россиянами, но и на уроках РКИ, в процессе работы со студентами – иностранцами. При этом следует учитывать индивидуальные способности и язык-посредник, который может помочь студенту выполнить данный тест. Такие занятия рекомендуется проводить в компьютерных классах, используя соответствующие программы.
В отличие от нормативно-ориентированных тестов, критериально-ориентированные обеспечивают дифференциацию только в сравнительно небольшой области вблизи порогового балла. Для этого теста задания подбираются приблизительно одинаковой трудности.
Эффективным признается тест, измеряющий знания обучаемых интересующего уровня подготовленности, при наименьшем числе заданий, качественно, быстро и дешево, удовлетворяя при этом всем требованиям оптимальности. Такой тест не может состоять из неэффективных заданий, т.е. заданий, не проверяющих какой-либо важный или ключевой элемент содержания учебной дисциплины. Эффективный тест должен в максимальной степени соответствовать уровню подготовки испытуемых, а его эффективность подчеркивает научность критериев его качества.
Приведенная система понятий составляет терминологическую базу современной педагогической тестологии. Для понимания сущности современных тестовых методов и технологий проверки знаний, оценки уровня обученности испытуемых и контроля образовательного процесса важно знание определений не только педагогического теста, но и других понятий, связанных с тестированием. Введение корректных определений обусловливает последовательность основополагающих концепций конструирования, создания, параметризации, использования тестов как педагогических измерителей и позволяет отличать их от псевдотестов.
Афонина Л.И. Критериально-ориентированное тестирование как эффективное средство оценки достижений учащихся: Дисс.: к.п.н.: 13.00.01 – Саратов, 2000.
Машбиц Е.И. Психолого-педагогические проблемы компьютеризации обучения. М., 1988.
Молчанов А.С. Педагогические информационные инновации как средство изменения качества образования: Дисс.: к.п.н.: 13.00.08. – Ставрополь, 2001.
Равен Дж. Педагогическое тестирование: проблемы, заблуждения, перспективы. М., 1999.
Челышкова М.Б. Теория и практика конструирования педагогических тестов. М., 2000.
Похожие статьи
тест, педагогический тест, задание, учебная дисциплина.
Концептуальные основы педагогического тестирования и его. тест, педагогический тест, задание, учебная дисциплина, умение, тестирование, дифференцирующая способность, образовательный процесс, долгое время, наилучший состав.
Методика определения количества тестовых заданий в субтесте.
тест, педагогический тест, задание, учебная дисциплина, умение, тестирование, дифференцирующая способность, образовательный процесс, долгое время, наилучший состав.
Тестирование как форма контроля результатов обучения
Методом исследования уровня знаний, умений, навыков, способностей и других качеств личности является такая форма контроля как тест. Тестология как теория и практика тестирования существует более 120 лет, и за это время накоплен громадный опыт.
Компетентностные тесты в системе контрольно-оценочных средств
Ключевые слова: федеральный государственный образовательный стандарт, педагогическое тестирование, компетентностно-ориентированный тест, оценка уровня сформированности обучающихся и студентов колледжа.
Сущность педагогического теста | Статья в сборнике.
тест, педагогический тест, специфическая форма, задание, система заданий, педагогическое измерение, образовательный процесс, педагогическая диагностика, пристальное внимание, анализ результатов.
Тестирование как одна из форм технологии оценивания.
Тестология как теория и практика тестирования существует более 120 лет, и за это время накоплен громадный опыт использования тестов в различных сферах человеческой деятельности, включая образование. В образовательном процессе тесты имеют большое.
Диагностический тест как система проверки знаний учащихся на.
При этом учебный диагностический тест призван выявлять не только причины допущенных во время
Русский язык», в состав которого входят контрольно-диагностические «Тесты по
Если это задание выполнено хорошо или отлично, дальнейшее тестирование можно было бы.
Основы методологии педагогического тестирования.
При этом сам процесс применения тестов предусматривает выполнение ряда требований
Педагогическое тестирование может использоваться как в школе, так и в высших учебных заведениях не только России, но и за рубежом.
О компьютерном тестировании в учебном процессе
тестирование, учебный процесс, задание, учащийся, ответ, процесс обучения, педагогический состав, компьютерное тестирование, Казахстан, вид контроля. Применение компьютерных дидактических тестов в учебном.
Похожие статьи
тест, педагогический тест, задание, учебная дисциплина.
Концептуальные основы педагогического тестирования и его. тест, педагогический тест, задание, учебная дисциплина, умение, тестирование, дифференцирующая способность, образовательный процесс, долгое время, наилучший состав.
Методика определения количества тестовых заданий в субтесте.
тест, педагогический тест, задание, учебная дисциплина, умение, тестирование, дифференцирующая способность, образовательный процесс, долгое время, наилучший состав.
Тестирование как форма контроля результатов обучения
Методом исследования уровня знаний, умений, навыков, способностей и других качеств личности является такая форма контроля как тест. Тестология как теория и практика тестирования существует более 120 лет, и за это время накоплен громадный опыт.
Компетентностные тесты в системе контрольно-оценочных средств
Ключевые слова: федеральный государственный образовательный стандарт, педагогическое тестирование, компетентностно-ориентированный тест, оценка уровня сформированности обучающихся и студентов колледжа.
Сущность педагогического теста | Статья в сборнике.
тест, педагогический тест, специфическая форма, задание, система заданий, педагогическое измерение, образовательный процесс, педагогическая диагностика, пристальное внимание, анализ результатов.
Тестирование как одна из форм технологии оценивания.
Тестология как теория и практика тестирования существует более 120 лет, и за это время накоплен громадный опыт использования тестов в различных сферах человеческой деятельности, включая образование. В образовательном процессе тесты имеют большое.
Диагностический тест как система проверки знаний учащихся на.
При этом учебный диагностический тест призван выявлять не только причины допущенных во время
Русский язык», в состав которого входят контрольно-диагностические «Тесты по
Если это задание выполнено хорошо или отлично, дальнейшее тестирование можно было бы.
Основы методологии педагогического тестирования.
При этом сам процесс применения тестов предусматривает выполнение ряда требований
Педагогическое тестирование может использоваться как в школе, так и в высших учебных заведениях не только России, но и за рубежом.
О компьютерном тестировании в учебном процессе
тестирование, учебный процесс, задание, учащийся, ответ, процесс обучения, педагогический состав, компьютерное тестирование, Казахстан, вид контроля. Применение компьютерных дидактических тестов в учебном.