Лекция 5. Тестирование в России и зарубежом.

 

1.      Развитие тестов в конце XX в. и в наши дни.

2.      Развитие тестов в психологии, образовании и армии.

3.      Развитие классической теории педагогических измерений и тестирования в XX веке.

4.     Создание современной теории тестов.

 

2. Развитие тестов в конце XX в. и в наши дни.

Новая история тестов в России началась в 90-е гг. XX в., когда стали больше говорить не о руководстве, а о научно обоснованном управлении учебным процессом, в информационном обеспечении которого важная роль по праву принадлежит тестам [3]. Новое понимание возможностей тестов в образовании способствовало росту научных исследований. В 90-е гг. XX в. появляются работы по пробле­мам измерений и тестирования в образовании, защищаются многочисленные кандидатские и докторские диссертации, издаются монографии, учебные пособия, журналы, проводятся конферен­ции и симпозиумы.

Последнее десятилетие XX в. в нашей стране совпало с перио­дом, бурного развития структур, занимающихся практической ра­ботой по созданию и применению тестов. К основным событиям этого периода можно отнести открытие в 1990 г. первой в стране кафедры педагогических измерений в Исследовательском центре проблем качества подготовки специалистов {директор Н.А.Селез­нева) Московского института стали и сплавов; создание при Московском государственном университете в этом же году Цент­ра тестирования «Гуманитарные технологии» (проект по компью­терному аттестационному тестированию для старшеклассников «Телетестинг» – научный руководитель А.Г.Шмелев); привлечение в 1991 г. Центра качества образования Института общего среднего образования РАО к участию в сравнительных международ­ных исследованиях по оценке учебных достижений (директор Цен­тра — Г.С.Ковалева); открытие в 1995 г. Центра тестирования вы­пускников общеобразовательных учреждений, преобразованного впоследствии в Федеральный центр тестирования со статусом го­сударственного учреждения Министерства образования и науки Российской Федерации; основание в 1998 г. государственной сис­темы тестирования иностранных граждан по русскому языку как иностранному при поддержке ведущих вузов Москвы, Санкт-Петербурга и других городов России. Перечень этот можно было бы смело продолжить. Начиная с 90-х гг. XX в. практически во всех регионах России создаются центры тестирования и аттестации учащихся, методические лаборатории по диагностике и центры, ка­чества образования.

Значимым событием в области подготовки кадров по педаго­гическим измерениям стало открытие в 2001 г. на факультете по­вышения квалификации Российского университета дружбы наро­дов (декан Т.М.Балыхина) кафедры тестологии (заведующая ка­федрой М.Б.Мельникова). На этой кафедре впервые в нашей стра­не началась реализация профессиональной образовательной про­граммы, рассчитанной на 1480 часов, для получения дополни­тельной квалификации «Тестолог (специалист в области педагогических измерений)».

Для повышения качества тестовых материалов, разрабатывае­мых в России, в 2000 г. при Исследовательском центре проблем качества подготовки специалистов Московского института стали и сплавов (технологического университета) был открыт Центр сертификации педагогических тестовых материалов (ПТМ) (директор В.И.Звонников) и создан Координационный совет Минобразова­ния России (в настоящий момент – Минобрнауки) по вопросам сертификации качества педагогических тестовых материалов.

Коренные изменения в отношении учителей к тестам произо­шли в 2001 г. в связи с началом эксперимента по введению едино­го государственного экзамена, благодаря которому тесты получи­ли официальное признание в России. За годы эксперимента значительно повысилась степень доверия к результатам тестирования со стороны органов управления образованием, образовательных учреждений, самих учителей, которые убедились в высокой объек­тивности и обоснованности баллов ЕГЭ, в их высокой прогностичности при отборе абитуриентов вузов. В 2002 г. был открыт Федеральный институт педагогических измерений (директор А.Г.Ершов), приоритетным направлением деятельности которо­го является научное, методическое и организационное сопровождение процесса создания контрольных измерительных Материа­лов (КИМ) для ЕГЭ.

В целом, подводя итоги развития тестирования в России, мож­но сказать, что на сегодняшний день среди ученых-педагогов в нашей стране наконец появилось понимание того, что теория педагогических измерений – наука, обладающая своей методоло­гией, методами и аппаратом, необходимым для разработки каче­ственных педагогических тестов. Сегодня большими тиражами издаются инновационные работы по педагогическим тестам оте­чественных ученых и зарубежных авторов, а также сборники ма­териалов КИМ ЕГЭ, специальные журналы по тестовой пробле­матике. Таким образом, можно считать, что на данный момент в России сформировалось сообщество профессионалов – специали­стов по разработке и применению тестов.

 

 

3. Развитие тестирования в психологии, образовании и армии.

Появ­ление педагогических тестов за рубежом нередко связывают с именем французского врача и психолога А.Бине (А.Binet). Его ра­бота по диагностике интеллектуальных способностей, вышедшая в 1905 г., считается точкой отсчета в становлении основных науч­ных подходов к измерениям в психологии и образовании [69]. Ко­нечно, были и более ранние попытки создания подобных тестов. Британские исследователи Ф.Гальтон (F.Gallon) и Дж.Кэттелл (J.Cattell) в 1890 г. использовали термин «тест на интеллект» (mental test) [1]. Им же принадлежит заслуга введения в научный оборот специальной характеристики качества теста (power of discrimina­tion), указывающей на его способность дифференцировать испытуемых по измеряемой переменной.

 Немного позднее идеи А.Бине были использованы немецким психологом и философом В.Штерном (W.Stem), который пред­ложил специальный коэффициент для оценивания интеллекта – коэффициент IQ. Этот термин используется до сих пор, правда, несколько в ином контексте. В США работы А.Бине по измерени­ям продолжил Л.Терман (L.Termari). Он создал новые тесты (Стэн-форда-Бине), представляющие собой оригинальную модифика­цию работы его предшественника [1].

 Достижения второго десятилетия XX в. в сфере измерений были связаны с проблемой распределения большого количества призывников по различным родам войск в США во время Первой мировой войны. Правительство Соединенных Штатов организовало «мозговой центр» из специалистов – составителей тестов, статистиков и экспертов по измерениям – и направило его работу на решение задач, продиктованных военной необходи­мостью. В этом центре свои усилия по отбору и распределению новобранцев объединили такие известные специалисты, как Э.Торндайк (Е.Thorndike), Р.Годдард (R.Goddard), П.Йеркс (Р.Yerkes) и Л.Терман (L.Terman). Результатом их работы стали знаменитые батареи Альфа и Бета тестов для армии, которые после стали использовать (вплоть до настоящего времени) в качестве примеров при обучении разработчиков тестов в образовании.

Первые стандартизированные измерители в образовании США были созданы для оценки качества почерка, правописания и вы­полнения арифметических действий в конце 20-х гг. XX в. Тогда же в Америке появилась батарея тестов SAT, разработанных по инициативе Совета колледжей и предназначенных для отбора абиту­риентов [1]. Несколько позже, в конце 40-х гг. XX в., были созда­ны батареи тестов достижений, реализующие идеи многомерных измерений и обеспечивающие сопоставимость результатов по раз­ным школьным предметам.

4. Развитие классической (традиционной) теории педагогических измерений и тестирования в XX в.

В 1904 г. англичанин Ч.Спирмен (С.Spearman) опубликовал фундаментальный теоретический труд по исследованию общих интеллектуальных способностей. Исполь­зуя школьные оценки но различным предметам, Ч.Спирмен применил к данным тестирования аппарат новой для того времени теории корреляции и выявил примеры ковариации оценок школь­ников. Тем самым он заложил основы научных подходов к обо­снованию качества тестов, соединив в своем исследовании тео­рию физических измерений, корреляционные методы и накоп­ленный, его предшественниками-психологами опыт оценивания способностей детей.

Прообразом научных положений теории педагогических изме­рений послужила далекая от образования работа Н.Р.Кэмпбедла «Основы физики» (1920), благодаря которой был разработан тео­ретический аппарат для анализа качества измерений, а обыден­ное представление о тесте и его научное определение стали замет­но различаться. Для обоснования качества педагогических измере­ний, их надежности и валидности была создана классическая те­ория тестов, получившая впоследствии название традиционной, и базирующаяся на концепции параллельных измерений и теории корреляции. На основе этой теории в 30—40-е гг. XX в. интенсив­но разрабатывались количественные методы для анализа качества тестовых заданий, строились стандартизованные тесты учебных достижений и осваивались методы шкалирования результатов вы­полнения тестов.

В конце 40-х гг. XX в. увлечение чистой теорией сменилось по­ниманием важности правильного применения измерений в сфере психологии и образования. Исследователи осознали тот факт, что к тестируемым нужно относиться бережно и осторожно и что любая ошибка в оценках может, привести к необратимым послед­ствиям. В этой связи в теории педагогических измерений активизировался поиск эффективных методов повышения надежности результатов тестирования, стали разрабатываться методы факторного, дисперсионного и корреляционного анализа данных, полу­чили широкое развитие методы формирования репрезентативных выборок, необходимых для стандартизации тестов.

Значимым событием конца 40-х гг. XX в. для развития теории и практики измерений в образовании стало создание в 1947 г. в США Службы образовательного тестирования – Educational Testing Service (ETS). Сегодня эта организация имеет представительства практически во всех странах мира. Из числа тестов, созданных ETS, наибольшую известность в связи с расширением программ международного обмена в обучении приобрел TOEFL, выявляющий уровни владения различными видами речевой деятельности для обучения в англоязычных странах.

5. Создание современной теории тестов.

 В истории тестов были этапы подъемов и спадов. В частности период ожесточенной критики пе­дагогических тестов наблюдался в США в конце 60-х гг. XX в. Широкая публичная дискуссия по проблемам использования те­стирования совпала по времени с научной критикой, вызван­ной недостатками классической теории тестов. Высказывались опасения в том, что тестирование служит инструментом подав­ления инициативы и творчества учащихся, слишком упрощенно трактует такие сложные конструкты, какими являются учебные умения, не объективно оценивает учебные достижения. Приво­дились и другие аргументы против широкого использования те­стов. Ученые-тестологи занимались в основном конструктивной научной критикой традиционных методов разработки тестов, что привело к построению новой теории – Item Response Theory (IRT), которую нередко в наши дни называют современной теорией те­стов.

 Неоспоримые преимущества IRT, связанные с возможностью прогноза надежности измерений, увеличения эффективности те­стирования и получением оценки параметров подготовленности учащихся, не зависящих от трудности заданий теста, стали широ­ко применяться на практике с конца 80-х гг. XX в. В это время были разработаны алгоритмы оценивания параметров испытуе­мых и заданий на основе математических моделей IRT, создано программное обеспечение и стали широко использоваться ПК. Со­четание аппарата классической теории и IRT при разработке тес­тов, открыло новые возможности повышения качества педагоги­ческих измерений и применения тестирования в образовании.

Современный период в истории развития тестов. Современный период в истории развития тестов характеризуется интенсивным развитием теории IRT, созданием новых моделей и методик ее применения, внедрением в тестирование компьютерных технологий, адаптивного тестирования, различных инноваций в области разработки и применения тестов. В настоящий момент наметился ряд направлений исследований, нацеленных на расширение возможностей педагогических измерений, разработку инновацион­ных измерителей и повышение качества тестов. К их числу отно­сится создание новых моделей педагогического измерения, инно­вационных форм тестовых заданий для проверки творческих и практико-ориентированных аспектов подготовленности учащих­ся, методов калибровки тестовых заданий и методик компьютер­ного моделирования тестов, обеспечивающих планируемую точ­ность измерений.

Большое внимание уделяется психолого-педагогическим про­блемам тестирования (проблемам тревожности, мотивации), раз­витию специальных процедур для выявления размерности про­странства измерений, созданию специальных методик, позволя­ющих обоснованно использовать результаты педагогических из­мерений в управлении качеством образования.