Лекция 17. Единый государственный экзамен, его компоненты, технология проведения, шкалирование и интерпретация результатов.

1. Цели и задачи эксперимента по введению ЕГЭ.

2. Контрольно-измерительные материалы (КИМы).

3. Технология разработки КИМов, организации и проведения ЕГЭ.

4. Шкалирование результатов ЕГЭ и использование их в управлении качеством образования.

5. ЕГЭ и Общероссийская система оценки качества образования.

1. Цели и задачи эксперимента по введению Единого государственного экзамена.

1. Цели эксперимента по введению Единого государственного экзамена. Эксперимент по введению ЕГЭ, начатый в 2001 г., Открывает новую страницу в развитии отечественной системы образования и имеет инновационный характер не только по замыслу, но и по форме проведения, по масштабам и отсутствию жесткой регламентации со стороны органов власти. Впервые в истории отечественного образования предпринята попытка не директивным, а экспериментальным путем определить целесообразность фундаментальной перестройки деятельности учебных заведений и системы управления качеством образования.

Эксперимент имеет две цели: повышение доступности высшего образования и качества среднего школьного образования, реализация которых достигается одновременно за счет совмещения в одной процедуре школьного выпускного экзамена и вступительного экзамена в высшие учебные заведения [9; 10]. По результатам ЕГЭ выпускники школ получают две оценки, одна из которых выставляется в школьной пятибалльной шкале, а другая — в стобалльной шкале для предоставления приемным комиссиям вузов и ссузов.

Задачи, решаемые с помощью ЕГЭ. К числу основных задач, решаемых в ЕГЭ, относятся:

- объективизация оценки качества образования на основе создания механизма внешнего оценивания и использования педагогических измерений;

- повышение доступности профессионального образования, в первую очередь для молодежи из малообеспеченных семей и из отдаленных от вузовских центров мест проживания;

- объективизация требований к' общеобразовательной подготовке абитуриентов учебных заведений в системе профессионального образования;

- снижение психологической нагрузки на выпускников общеобразовательных учреждений за счет уменьшения числа экзаменов; - развитие преемственности общего и профессионального образования, обеспечивающей готовность выпускников» школ продолжить образование;

- совершенствование системы.государственного контроля и управления качеством образования на основе независимой оценки качества подготовки выпускников.

Решение последней задачи, в частности, позволяет говорить о существенном вкладе ЕГЭ в становление и развитие Общероссийской системы оценки качества образования (ОСОКО), создание которой происходит сейчас в России. Выполняя свои основные задачи, ЕГЭ является важным структурным элементом ОСОКО и одним из центральных звеньев в развитии и совершенствовании системы управления качеством образования.

Решение перечисленных задач обеспечивается выполнением работ по ряду направлений, к которым относятся: формирование нормативно-правовой базы эксперимента; создание КИМ; разработка технологии проведения ЕГЭ; обеспечение информационной безопасности процедур, материалов и результатов экзамена; формирование информационных систем сопровождения эксперимента и использования его данных в образовании; подготовка специалистов для кадрового обеспечения эксперимента; мониторинг ЕГЭ; анализ и интерпретация данных мониторинга в целях повышения качества образования.

Схемы участия регионов в ЕГЭ и развитие эксперимента. После принятия решения об участии в ЕГЭ регион на добровольной основе выбирает одну из возможных схем проведения экзамена, которая может отличаться от других количеством и составом предметов, добровольностью или обязательностью аттестации выпускников школ в форме ЕГЭ долей компьютерного тестирования и другими специфическими особенностями, обусловленными финансовыми возможностями региона, его материальной базой, уровнем развития коммуникаций, числом вузов, их готовностью к участию в эксперименте и т.д.

В соответствии с основной линией на отсутствие жесткой директивности со стороны федеральных органов управления образованием в ЕГЭ сохраняется максимально возможная вариативность схем проведения, которые нередко меняют сами регионы в процессе развития эксперимента.

Несмотря на существующую нормативную базу, определяющую перечень обязательных предметов при итоговой аттестации выпускников школ, многие регионы в рамках работ по совершенствованию схемы проведения ЕГЭ отказываются от обязательных предметов и предоставляют выпускникам право самостоятельного выбора числа экзаменов и самого участия в ЕГЭ. Показательно, что по мере расширения сферы действия принципов вариативности и добровольности число участников эксперимента неуклонно растет вместе с проявлением позитивного отношения общества к эксперименту.

Анализ данных мониторинга ЕГЭ убедительно свидетельствует о резком увеличении числа регионов, участвующих в эксперименте, и повышении доверия к ЕГЭ со стороны органов управления образованием, профессионального сообщества вузов и школ, учащихся и их родителей. В частности число регионов — участников эксперимента — изменилось с 6 в 2001 г. до 78 в 2005 г.,- а количество выпускников этих регионов, сдававших в 2005 г. экзамены в форме ЕГЭ по математике и русскому языку, превысило 50 % [41]. Значительно расширился список вузов и ссузов, принимающих абитуриентов по результатам ЕГЭ. В 2005 г. в эксперименте приняли участие 1543 вуза (включая филиалы) и 1765 ссузов, тогда как в 2001 г. в нем участвовали лишь 16 вузов. Резко увеличилось общее количество предметов, выносимых на ЕГЭ в регионах. Согласно данным мониторинга и региональной статистики, за годы эксперимента существенно возросло число выпускников из сельских районов, поступивших в вузы по результатам ЕГЭ. В целом тенденции эксперимента говорят о том, что связываемые с ЕГЭ надежды на расширение доступности высшего образования для жителей сельских и отдаленных районов России полностью оправдываются. Это находит свое подтверждение в данных мониторинга ЕГЭ.

Участие учителей в проведении ЕГЭ. Учителя нередко выступают организаторами проведения ЕГЭ в школах, однако они работают только с теми выпускниками, которые не являлись ранее их учениками. В этом случае педагоги принимают участие в подготовке к проведению экзамена, организуют саму процедуру тестирования, обеспечивают сбор и отправку материалов экзамена.

При подготовке к тестированию учителя получают все необходимые материалы, включающие комплекты КИМ с запасными материалами на случай опечатки, списки выпускников, формы протоколов проведения тестирования, в которых отмечаются все отклонения от требований стандартизации» и руководство по проведению тестирования, включающее описание всех требований к проведению ЕГЭ.

После завершения экзамена организаторы собирают материалы: использованные и неиспользованные тесты, заполненный протокол проведения тестирования и прилагают списки учащихся. Эти материалы передаются в специальные центры для проверки и дальнейшей обработки, получившие в системе ЕГЭ название региональные центры обработки информации (РЦОИ). Задания с выбором ответов подвергаются автоматизированной проверке на местах или в Москве, а для проверки заданий с развернутыми ответами приглашаются эксперты, работа которых организуется по месту проведения экзамена в условиях полной информационной безопасности и независимости экспертных суждений.

2. Контрольные измерительные материалы

Структура КИМ. В структуре КИМ выделяют три части (А, В, С), имеющие различное число заданий в зависимости от предмета. Например, заданий по биологии и истории может быть 50, а по русскому языку— 40,

В части А по всем предметам содержатся только задания с выбором ответов. Задания части В значительно варьируют по форме и предполагают возможность краткого регламентированного ответа, установления соответствия между элементами двух множеств и правильной последовательности различных процессов, явлений, объектов. Часть С предназначается для свободного конструирования ответа. Например, при тестировании по русскому языку дается задание написать небольшую письменную работу (сочинение), по математике — дать развёрнутые решения заданий и т.д.

Содержание КИМ. Результаты ЕГЭ используются при итоговой аттестации учащихся и отборе абитуриентов. Содержание КИМ предназначено для получения персонифицированной информации о достижении выпускниками школ базового и повышенного уровней подготовки по предметам. Поскольку при аттестации требуется проверить освоение- выпускниками большинства элементов предметной подготовки, а время экзамена ограничено, для повышения репрезентативности охвата содержания образования приходится варьировать спецификации КИМ ЕГЭ незначительно внутри одного года и более существенно по годам. Благодаря специальному планированию, осуществляемому предметными комиссиями по разработке КИМ, за 2—3 года удается охватить все необходимые содержательные элементы. Из-за вариации спецификаций КИМ снижается сопоставимость результатов выпускников, но расширяются возможности использования результатов ЕГЭ на федеральном и региональном уровнях в мониторинге качества образования. Таким образом, на основе анализа результатов по отдельным годам ЕГЭ удается получить обоснованную информацию о тенденциях в изменении общеобразовательной подготовки выпускников школ России.

В целом содержание КИМ отбирается на основе спецификаций, которые ежегодно обновляются в Интернете и включают обобщенные планы экзаменационных работ со ссылками на соответствующие позиции кодификаторов (пронумерованных перечней содержательных элементов по предметам). В содержании КИМ отображаются только предметные знания и умения, которым обучают в школе, хотя это противоречит современным воззрениям на приоритеты в обучении, принятым во многих, странах. Вследствие этого российские учащиеся показывают невысокие результаты в международных сравнительных исследованиях качества образования. Они не умеют выполнять задания, требующие приме нения знаний в ситуациях, имитирующих жизненные, или междисциплинарных умений.

Анализ результатов выполнения КИМ в контексте содержательной интерпретации дает важную информацию для совершенствования требований ГОС и повышения качества образования. Согласно результатам анализа, проведенного предметными комиссиями по разработке КИМ и опубликованного в 2006 г. в аналитическом докладе [41], задания базового уровня трудности выполняют в основном выпускники, получившие по ЕГЭ хорошие и отличные оценки. Процент учащихся этой группы, справившихся со всеми заданиями базового уровня, несколько выше по математике и русскому языку (более 90 %) и ниже по остальным предметам (не более 85 %). Около половины выпускников, получивших по результатам ЕГЭ «два» и «три», не осваивают и половины планируемого к изучению материала. Этот результат помогает выявить проблемы, связанные с завышенными требованиями ГОС и излишним объемом содержания школьного образования.

3. Технология разработки контрольно-измерительных

материалов, организации и проведения

Единого государственного экзамена

Структуры, участвующие в организации и проведении ЕГЭ. К числу структур, осуществляющих организационно-управленческую и научно-методическую поддержку при реализации технологии ЕГЭ, относятся федеральные и региональные органы управления образованием, Федеральный центр тестирования (ФЦТ), Федеральный институт педагогических измерений (ФИПИ), компания «КРОК», региональные центры обработки информации и различные организации (вузы и другие образовательные структуры), выполняющие на конкурсной основе исследовательские проекты для формирования научно-методических основ технологии проведения ЕГЭ и совершенствования КИМ.

Технология разработки КИМ. Технологический ежегодный цикл разработки КИМ по предмету начинается с пересмотра кодификатора элементов содержания, подлежащих проверке, а также с создания спецификации и демонстрационного варианта КИМ. Обычно по 13 Предметам, заявленным в ЕГЭ, ежегодно разрабатывается не менее 10 тысяч новых заданий. Помимо целевого заказа на задания для пополнения банка ЕГЭ объявляется конкурс, в котором принимают участие все желающие авторы тестовых заданий из различных регионов России. Материалы, представленные на конкурс, проходят экспертизу, по результатам которой осуществляется отбор и покупка тестовых заданий для банка ЕГЭ. Специалисты ФИЛИ, используя банк, формируют варианты КИМ. Затем проводится экспертиза качества содержания вариантов, анализ их параллельности и соответствие заданий требованиям тестовой формы. После коррекции, основанной на результатах экспертизы, КИМ передаются на апробацию, проводимую на репрезентативных выборках учащихся_: школ России. Обработка данных апробации и их анализ позволяют выполнить очередную коррекцию, после завершения которой получаются эквивалентные варианты КИМ с комплектами сопроводительной документации для проведения ЕГЭ, созданные в условиях высокого уровня информационной 'безопасности и хранящиеся в специальных помещениях до начала ЕГЭ.

После проведения экзамена и обработки данных специалисты ФИПИ готовят аналитический отчет, содержащий рекомендации по совершенствованию КИМ, которые учитываются при выполнении очередного ежегодного технологического цикла.

Технология проведения ЕГЭ. При проведении ЕГЭ основной технологией является бланочная, предполагающая выдачу заданий выпускникам на бумаге. Реализация бланочной технологии зависит от организации, занимающейся ее осуществлением. Так, ФЦТ все материалы печатает в Москве, а затем перед началом экзамена передает пакеты с КИМ и бланками ответов в регионы, КРОК поддерживает технологию, при которой бланки ответов распечатываются по месту применения в регионах.

При использовании, компьютерного тестирования, в ЕГЭ технология носит смешанный характер, поскольку задания части С с развернутыми ответами выполняются на бумажных бланках. Единая технология проведения ЕГЭ пока еще не сложилась. Каждый из вариантов проведения эксперимента имеет свои достоинства и недостатки, выявить которые в полной мере можно лишь по его окончанию.

4. Шкалирование результатов Единого государственного

экзамена и использование их в управлении

качеством образования

Виды используемых шкал в ЕГЭ. В соответствии с заявленными целями и решаемыми задачами по данным ЕГЭ выставляются две оценки — в сто- и пятибалльной школьной шкале. Первую получают специалисты ФЦТ путем шкалирования первичных данных ЕГЭ, преобразования их в стандартную шкалу логитов на основе современной теории тестов. Вторая, школьная, выбирается специалистами группы по шкалированию, организуемой Рособрнадзором во время экзаменов и состоящей из тестологов, представителей предметных комиссий ФИПИ и сотрудников ФЦТ. Для выбора границ интервалов стобалльной шкалы и установления их соответствия оценкам четырехбалльной шкалы результаты ЕГЭ по каждому предмету и всем регионам подвергаются многоаспектному анализу, включающему проблемы содержательной: валидности школьных баллов и сопоставимости оценок по предмету в ЕГЭ разных лет.

Сопоставимость результатов ЕГЭ разных лет. Для обеспечения содержательной сопоставимости результатов тестирования многие страны, в которых есть национальные экзамены в форме тестов или другие виды массового тестирования, вводят стандартизованные уровневые шкалы (см. раздел 13.5), позволяющие проследить связь между содержанием тестов по годам. Важное преимущество уровневых шкал заключается в расширении возможности интерпретации результатов экзаменов, поскольку тестовый балл можно дополнять содержательным описанием подготовки вьь пускников школ в терминах, освоенных и не освоенных тематических элементов предмета.

Для введения содержательной интерпретации в практику ЕГЭ необходимо, прежде всего, провести цикл работ по совершенствованию структуры ГОС на основе идей уровневой дифференциации [66] и содержательно описать различные уровни общеобразовательной подготовки по всем школьным предметам. Затем на репрезентативной выборке выпускников школ России следует построить устойчивую шкалу стандартных тестовых баллов и выделить диапазоны шкалы путем соотнесения их с содержанием заданий, выполненных на каждом уровне.

В терминах теории педагогических измерений сопоставимость означает возможность переноса результатов тестирования различных лет на единую шкалу. Сопоставимость обеспечивает выпускнику возможность однократной сдачи ЕГЭ и использования своих результатов при неудачном поступлении в вуз в последующие годы, а управленцам — возможность проведения сравнительных исследований качества образования.

Традиционный подход к решению проблемы сопоставимости основан на определении норм так называемого якорного теста для составления таблиц эквивалентности баллов по разным тестам. В качестве якорного выбирается тест, который стандартизуется на национальной репрезентативной выборке испытуемых, тщательно сформированной из генеральной совокупности в масштабах всей страны.

На основе якорного теста определяются репрезентативные общенациональные нормы по различным предметам. Данные, собранные на национальной выборке по якорному тесту, служат для построения шкалы единых показателей. Каждый новый тест, разрабатываемый в последующие годы, калибруется относительно якорного теста, в результате чего можно установить, какой результат испытуемого в последующие годы эквивалентен показателю в якорном тесте.

Для построения таблиц перевода в общем случае на одной и той же выборке испытуемых обычно используют метод равных перцентилей, согласно которому показатели считаются эквивалентными, если они имеют равные перцентилей и получены на нормальной группе сравнения по параллельным вариантам тестов. К недостаткам метода можно отнести высокую стоимость, неизбежную коррекцию и совершенствование содержания тестов, изменение содержания образования и приоритетов в учебных дог стяжениях, а к достоинствам — стабильность и высокую точность, поскольку результаты по всем последующим версиям тестов сравниваются с одним якорным тестом.

В связи с появлением теории IRT стали использовать более эффективные технологии, обеспечивающие сопоставимость результатов тестирования по различным годам. Эта технология основана на включении в тесты различных лет групп якорных (общих) заданий, связывающих цепочкой результаты по более поздним и более ранним версиям теста. Отсчет ведется от шкалы, построенной на эталонной группе сравнения. Тем самым каждый вариант очередной версии теста благодаря блоку общих заданий связывается с предыдущим и последующим вариантами батареи тестов.

Для пользователей тестов обычно разрабатываются необходимые разъяснительные материалы, обеспечивающие перевод сырых баллов в производные показатели, сопоставимые с результатами эталонной шкалы. Дополнительные меры по повышению сопоставимости результатов тестирования обеспечиваются специальной теорией выравнивания тестов. Аналогичные современные методы планируется использовать в ЕГЭ.

5. Единый государственный экзамен и Общероссийская система оценки качества образования

Что понимают под Общероссийской системой оценки качества образования. Под Общероссийской системой оценки качества образования понимается совокупность организационных и функциональных структур, которая обеспечивает основанную на единой концептуально-методологической базе оценку образовательных достижений граждан, а также выявление факторов, влияющих на образовательные результаты [10; 11].

Основная цель создания ОСОКО заключается в повышении объективности и обоснованности информационной основы системы управления качеством образования в России, а также обеспечении всех участников образовательного процесса и общества в целом достоверной информацией о качестве образования в стране.

В соответствии с поставленной целью к основным задачам ОСОКО можно отнести:

- оценку качества учебных достижений обучаемых и выпускников учебных заведений на различных образовательных ступенях;

- разработку научно-методического обеспечения процедур и инструментария для оценки качества образования;

- создание структур, обеспечивающих качество инструментария и технологий педагогических измерений (центров сертификации);

- создание центров статистической обработки и анализа данных о качестве образования, организацию системы подготовки и переподготовки педагогических кадров и т.д.

Процесс создания ОСОКО в России пока не завершен, поэтому число основных задач по мере ее становления может меняться.

Построение ОСОКО предполагает широкое использование существующих организационных структур, механизмов и процедур: ЕГЭ, центров сертификации, аттестации и аккредитации, центров качества образования и мониторинга, работающих на единой научно-методической основе в рамках стратегии развития общероссийской системы оценки качества образования.

ЕГЭ в ОСОКО. ЕГЭ является неотъемлемым структурным элементом ОСОКО и обеспечивает объективную информацию о реальном состоянии качества школьного образования. Данные ЕГЭ позволяют получить оценки состояния образовательных достижений выпускников школ, выявить тенденции и динамику изменения системы среднего образования, сформировать совокупность основных факторов, влияющих на качество образования в различных регионах, и оценить меру их влияния.

ЕГЭ не является единственным информационным источником ОСОКО. Несомненно, что помимо собранной в процессе экзамена информации о предметных знаниях и умениях выпускников школ необходимы дополнительные данные, характеризующие состояние качества образования на различных ступенях (оценки умений применять знания, собранные с помощью портфолио и других средств аутентичного оценивания; оценки междисциплинарных, общеучебных и коммуникативных умений; данные об уровне воспитанности обучаемых и результативности воспитательных воздействий; результаты участия учащихся в олимпиадах и творческих конкурсах и т.д.).

Важным требованием, обеспечивающим корректность использования данных ЕГЭ в ОСОКО, является учет различных факторов при интерпретации результатов экзамена, лежащих зачастую за пределами влияния школы, но существенно влияющих на качество образования.