Лекция 9. Содержание педагогического теста.
1. Целеполагание при планировании содержания педагогического теста. 2. Планирование содержания педагогического теста. 3. Экспертиза качества содержания теста.
1. Целеполагание при планировании содержания педагогического теста
Общие замечания. Содержание теста формируется путем отображения учебного материала в системе тестовых заданий. Для обеспечения высокой конструктной и содержательной валидности результатов педагогических измерений необходимо использовать определенную методику, включающую вопросы целеполагания, планирования и оценки качества содержания теста. В содержании теста стараются отобразить то главное, что должны усвоить ученики, поскольку все результаты обучения проверить невозможно. Для этого прежде всего необходимо структурировать цели обучения и ввести определенную их иерархию. Таксономия целей, используемая при разработке теста, должна носить предметно-ориентированный характер, поскольку каждая дисциплина имеет свои приоритеты. При построении таксономии иногда ограничиваются простым перечислением целей обучения, как в примере, рассмотренном в следующем разделе. Таксономии целей обучения. В настоящее время наиболее известной является таксономия целей Б.С.Блума (В. S.Bloom) [70]. Данная таксономия очень технологична и с точки зрения большинства разработчиков педагогических тестов вполне приемлема для целей тестирования. В частности в своей классификации Б.С.Блум выделяет: - знание названий, имен, фактов; - знание определений и понимание их смысла; - сравнительные, сопоставительные знания; - классификационные знания; - знание противоположностей, противоречий, синонимичных и антонимичных объектов; - ассоциативные знания; - причинные знания; - алгоритмические и процедурные знания; -оценочные знания и т.д. В 90-е гг. XX в. таксономия Б.С.Блума подвергалась значительной критике в связи с неполным отражением современных достижений в области психологии обучения и отсутствием связи с классификацией видов познавательной деятельности учащихся. К числу ее недостатков зарубежные исследователи отнесли излишнюю упрощенность, не позволяющую использовать современные теории процесса обучения; избыточное внимание к оценке результата обучения, а не к процессу формирования результата; отсутствие зависимости между отдельными составляющими модели [60]. В нашей стране таксономия Б.С.Блума также неоднократно критиковалась в основном в связи с тем, что в ней произошло методологически недопустимое смешение конкретных результатов обучения (знание, понимание и т.д.) с операциями, представляющими необходимое условие их достижения (анализ, синтез, оценка). Новая концептуальная модель целей обучения, предложенная К.Бигсом и Д.Коллисом (С.Biggs and D.Collis), получила название СОЛО-таксономия (SOLQ – Structure of the Observed Learning Outcomes). В ней содержится детальная классификация категорий познавательной деятельности, позволяющая планировать различные ее уровни в концептуальной модели содержания теста. Спектр уровней познавательной деятельности, представленный в СОЛО-таксономии, достаточно широк: от воспроизведения фактов и простейших алгоритмов до разнообразных интеллектуальных и практических умений, базирующихся на теории Ж.Пиаже об этапах развития познавательной деятельности. Данная таксономия имеет иерархическую структуру, поэтому ее удобно использовать как для разработки инструментария, так и при интерпретации результатов педагогических измерений [28]. В основу планирования содержания тестов может быть положен уровневый системный подход описания достижений учащихся, разработанный учеными отечественной педагогической школы и позволяющий сгруппировать результаты обучения в зависимости от уровней учебной деятельности. Первый уровень связан с непосредственным воспроизведением по памяти содержания изученного материала и его узнаванием. Второй уровень предполагает понимание и применение знаний в знакомой ситуации по образцу, а также выполнение действий с четко обозначенными правилами. Третий уровень включает использование знаний в измененной или незнакомой ситуации (И.Я.Лернер, В.П.Беспалько и др.) [7; 33]. Использование уровневого подхода будет более эффективно, если связать уровни усвоения учебного материала с характеристиками внешней деятельности учащегося, задав требования к ее проявлению (табл. 2). Таблица 2 Требования к внешней деятельности учащегося
Целеполагание на этапе планирования содержания теста. В отличие от содержания традиционных средств контроля, которое формируется в основном интуитивно на основании практического опыта, отбор содержания теста имеет четкую целевую направленность. При планировании содержания контроля в методической литературе рассматривают систему изучаемых объектов, виды учебной деятельности и характеристики качества усвоения учебного материала. Описание объектов изучения обычно дается с учетом глубины их освещения учителем и планируемого уровня усвоения учащимися. Группой исследователей НИИ СиМО АПН была предложена общепредметная схема, организующая множество объектов изучения в определенную структуру на основе морфологического и функционального анализа содержания предметов [32]. К важнейшим элементам системы научных знаний исследователи отнесли понятия и факты, законы, теории, идеи, знания о способах деятельности, методологические и оценочные знания и др. В основу классификации и систематизации видов учебной деятельности можно положить структурированные умения, предложенные И.И.Кулибабой. К ним относятся: - специальные умения, формирующиеся в процессе изучения отдельных учебных предметов; - общие умения по организации рационального учебного труда, включающие умения пользоваться различными источниками знаний для решения познавательных задач, планировать и организовывать свою учебную деятельность, контролировать и корректировать результаты учебной деятельности, а также управлять ею в процессе учения; - интеллектуальные умения, представляющие собой ядро учебной деятельности и объединяющие все учебные предметы. Характеристики качества усвоения учебного, материала можно рассматривать на различных уровнях. Первый уровень – планирование обучения, когда определенные представления о планируемом качестве подготовки закладываются в образовательные программы по каждому предмету. Второй уровень обычно ассоциируется с этапом реализации образовательных программ в учебном процессе, а третий уровень связывается с оценкой качества результатов учебного процесса. Обобщение результатов ряда отечественных научно-методических работ позволяет говорить о различии в подходах при трактовке качества результатов учебного процесса. В одних случаях категорию качества отождествляют с полнотой знаний и их глубиной. В других случаях под качеством знаний понимают степень их обобщенности или системности, конкретности и осознанности. Иногда приоритет отдают логичности изложения материала, рациональности способов и приемов решения учебных задач. В практике обучения чаще всего встречается упрощенная ситуация, когда знания обучаемого считают качественными, если он выполняет задания повышенной сложности из числа тех, что предлагаются при контроле в классе. Возможность оценки качества подготовки как результата обучения в 60—80-е гг. XX в. в отечественной научной школе подвергалась сомнению. По мнению критиков, представление о качестве подготовки должно ассоциироваться с внутренним состоянием обучаемого, в то время как результаты обучения проявляются во внешних, наблюдаемых признаках и результатах учебного процесса. Состоятельность подобных критических суждений легко опровергается в наши дни благодаря достижениям теории педагогических измерений и современной теории тестов IRT. Идея перехода от внешнего к внутреннему, идея интериоризации, составляет ядро теории педагогических измерений. По наблюдаемым результатам теста с той или иной степенью точности пытаются сделать вывод о внутренних устойчивых характеристиках – латентных параметрах подготовленности учащихся. При контроле совершается обратный ход, поскольку на деле именно множество этих параметров испытуемых в процессе взаимодействия с множеством заданий порождает наблюдаемые результаты выполнения теста. Использование математических моделей измерения теории IRT, соединяющих оба множества и устанавливающих между ними функциональную связь, позволяет решить проблему оценки качества подготовки испытуемых и перейти к оценкам параметров учащихся путем специальной обработки результатов педагогических измерений. Операционализация и конкретизация планируемых результатов обучения. Корректное планирование содержания теста затрудняют излишняя общность, расплывчатость, многообразие и неопределенность формулировок образовательных целей. Поэтому для создания тестов необходима предварительная конкретизация и операционализация планируемых результатов обучения. Процесс операционализаиии заключается в придании форме представления целей обучения тех характеристик, которые позволяют однозначно отобразить их в содержании тестов [60]. Идея операцйонализации очень близка положениям М.В.Кларина и зарубежных авторов Т.Кубисзина и Г.Борича (T.Kubiszyn, G.Borich), которые используют иной, довольно удачный термин «конкретизация» [27]. Конкретизация, по мнению М.В.Кларина, должна начинаться с описания воздействия обучения на ученика, прояснения характера воздействия и детализации его результатов. Поэтому процесс конкретизации требует характеристики образовательных условий, выявления внутренних параметров учащихся, их способности к усвоению нового учебного материала и описания результатов образовательного процесса. Повышению конкретизации описания результатов учебной деятельности, по мнению М.В.Кларина, способствует использование ряда глаголов, непосредственно характеризующих действия ученика. Для конкретизации учебных целей исследователь предлагает применять следующие глаголы: «анализировать», «вычислять», «высказывать», «демонстрировать», «знать», «интерпретировать», «использовать», «оценивать», «понимать», «преобразовывать», «применять», «создавать» и т.п. Для конкретизации целей творческого типа – «варьировать», «видоизменять», «модифицировать», «перегруппировать», «перестроить», «предсказать», «поставить вопрос», «синтезировать», «систематизировать» и т.п. Для обозначения целей в области развития устной и письменной речи – «выделить», «выразить в словесной форме», «записать», «обозначить», «подчеркнуть» (в смысле выделить), «продекламировать», «произнести», «прочитать», «разделить на составные части», «рассказать» и т. п. Процесс операционализаиии характеризуется рядом этапов, которые схематично изображены на рис. 16. Рис. 16. Этапы операционализации результатов обучения
После выполнения всех этапов планируемые результаты обучения представляются в виде совокупности контрольных заданий теста. На этой стадии операционализация позволяет структурировать, расчленять, а иногда и наоборот, укрупнять, уточнять и детализировать содержание дисциплины для его отображения в содержании теста. Именно этот этап обеспечивает переход от теоретического уровня анализа целей обучения к эмпирическому и позволяет концептуально правильно подойти к выделению эмпирических индикаторов – заданий теста.
2. Планирование содержания теста
Модели планирования. В процессе планирования содержания теста становится понятным, что далеко не весь набор целей обучения по разным причинам можно отобразить в тесте. Конечно, чем глубже и полнее отображение, тем выше содержательная валидность теста, тем больше оснований доверять тестовым баллам учащихся. Однако на практике приходится думать не только о требованиях тестовой технологии, но и о реальных возможностях школьников определенного возраста, которые в процессе выполнения теста не должны испытывать излишнего напряжения и усталости. В этой связи набор целей обучения необходимо структурировать и выделит самые важные цели, которые должны обязательно попасть в тест. Структуризация целей различного уровня иерархии позволяет уточнить определенные предметные области, разделы и темы, содержание которых необходимо отразить в тесте. Знание, предметных областей выражается правилами измерения с перечислением элементов содержания в совокупности с желаемыми, планируемыми при обучении уровнями владения этими элементами. Таким путем общие цели обучения конкретизируются. В результате возникает прагматическое определение знания учебной дисциплины, когда испытуемый должен правильно выполнить определенные задания теста. Особые сложности в оценке учебных достижений вызывает выявление уровня владения интеллектуальными и практическими умениями, которые, по своей сути, слабоалгоритмизируемы, сложны, неоднозначны при проверке и требуют, как правило, создания концептуальных моделей, альтернативных существующим. Из апробированных на практике в настоящее время наибольшее применение находит трехмерная модель планирования теста, включающая содержание, технологические требования и планируемый уровень познавательной деятельности, необходимый для выполнения заданий теста [35]. Первая составляющая модели – содержание – обеспечивает содержательную вадидность инструментария, его соответствие учебным программам. Под второй составляющей модели – технологическими требованиями – в основном понимается используемый тип заданий. Необходимость введения второй составляющей появилась сравнительно недавно в связи с расширением применяемых форм заданий теста. Помимо традиционных заданий с выбором ответа используются задания со свободным ответом как в краткой, так и в развернутой форме, экспериментальные задания и др. Третьей составляющей модели является уровень осуществляемой познавательной деятельности, на оценку которого направлено измерение. Спецификация теста. После определения целей тестирования и их конкретизации разрабатывается спецификация теста. Для этого делается примерная раскладка процентного, соотношения содержания разделов и определяется необходимое число заданий по каждому разделу дисциплины, исходя из его важности и числа часов, отведенных на него в программе. Раскладку начинают с подсчета планируемого исходного числа заданий в тесте, которое в процессе работы над тестом будет неоднократно меняться в сторону увеличения или уменьшения. Обычно предельное число заданий по математике или физике для учащихся старших классов не превышает 20—30, а по гуманитарным наукам нередко доходит до 60—80. Оптимальное время тестирования зависит от многих факторов: целей тестирования, возраста учащихся, подхода к разработке теста, специфики контролируемого содержания и т.д. Как правило, в старших классах это время составляет от 1,5 до 2 часов. В ЕГЭ, например, на выполнение теста по математике в 2006 г, отводилось 4 астрономических часа, а на тест по русскому языку – 3. В спецификации теста обязательно фиксируется структура, содержание проверки и процентное соотношение заданий в тесте. Иногда спецификацию делают в развернутой форме, содержащей дополнительные сведения о тесте. Спецификация в развернутой форме включает: 1) цель создания теста, описание подхода к его созданию и возможных сфер применения теста; 2) перечень нормативных документов (базисных программ, требований к уровню подготовки выпускников и др.) и перечень учебников, используемых при планировании содержания теста; 3) описание общей структуры теста, включающее перечень субтестов (если они есть) с указанием, подходов к их разработке; 4) число заданий различной формы с указанием ключей ответов и оценочных правил для заданий со свободно конструируемыми ответами; 5) число параллельных вариантов теста; 6) вес каждого задания, рекомендуемый автором теста, в общей оценке результатов выполнения теста; 7) рекомендуемое время выполнения теста, в том числе на каждый субтест, среднее время выполнения одного задания с учетом специфики формы; 8) соотношение заданий по различным разделам и видам учебной деятельности; 9) рекомендации по контингенту учащихся для апробации теста; 10) характеристику полноты охвата требований ГОС (в процентах) и перечень требований ГОС, не вошедших, в тест; 11) рекомендуемую автором стратегию расположения заданий в тесте. Один из наиболее распространенных подходов к созданию краткой спецификации основан на сопряжении системы знаний и умений с процентным соотношением заданий по различным разделам или содержательным линиям проверяемой дисциплины в тесте (пункт 8 развернутой спецификации). Гипотетический пример реализации подобного сопряжения без привязки к какому-либо предмету приведен в табл. 3. В нее включен перечень знаний и умений по четырем содержательным разделам. Таблица 3
Содержательный план теста
Примечание. А – знание понятий, определений, терминов; В – знание законов и формул; С – умение применять законы и формулы для решения задач; D – умение интерпретировать результаты на графиках и схемах; Е – умение проводить оценочные суждения.
Подобного рода перечень знаний и умений, ориентированный на конкретную дисциплину, составляется всегда при планировании содержания теста. Естественно, что в приведенный перечень знаний и умений необходимо ввести некоторые пропорции сообразно тем акцентам, которые делаются преподавателем в учебном процессе. Для заполнения таблицы было выбрано 60 заданий в качестве первоначальной длины теста. Доля каждого из разделов в процентах указана в табл. 3. Конечно, при заполнении таблицы в распределении заданий удается лишь приближенно отобразить пропорции разделов. К тому же числа вписываются не во все ячейки (например, ячейка на пересечении второго столбца и пятой строки), поскольку некоторые умения могут оказаться несовместимыми с содержанием отдельных разделов. Однако даже в таком приближенном видении обшей раскладки заданий есть огромная польза для разработки теста. Спецификация может также содержать процентное соотношение заданий, планируемое сообразно пропорциям разделов и видам предполагаемой деятельности испытуемого в процессе выполнения теста. Естественно, что в процессе работы над тестом первоначальная раскладка заданий будет претерпевать всяческие изменения. Это объясняется тем, что не все задания окажутся удачными и уместными в той мере, как это считается на этапе планирования теста. Поэтому после коррекции теста необходима доработка спецификации для приведения ее в соответствие с окончательными пропорциями содержания теста. Общие принципы отбора содержания теста. Общие принципы отбора содержания теста способствуют обеспечению высокой содержательной валидности теста [60]. Первый принцип – принцип репрезентативности – регламентирует процедуру отбора содержания таким образом, чтобы обеспечить оптимальную полноту и правильность пропорций содержания теста. Второй принцип – принцип значимости – предписывает включать в тест наиболее значимые элементы содержания, относящиеся к опорным темам курса. Выделение опорных элементов требует структурирования содержания предмета перед его отбором в тест. Третий принцип – принцип системности – предполагает подбор упорядоченных содержательных элементов, связанных между собой определенной иерархией и обшей структурой знаний. При соблюдении этого принципа тест можно использовать не только для выявления уровня учебных достижений, но и для оценки качества структуры знаний учеников. После планирования содержания теста и его отбора начинается наиболее ответственный этап создания предтестовых заданий, по окончанию которого проводится экспертное оценивание содержательной валидности теста.
3. Экспертиза качества содержания теста
Методика экспертизы. Оценка качества содержания теста должна проводиться по определенной методике независимыми экспертами, не участвовавшими в разработке теста. Как правило, число экспертов составляет не менее трех человек по каждому тесту. К экспертизе привлекаются наиболее опытные учителя, имеющие большой стаж работы с теми учащимися, для которых в конечном итоге предназначен тест. Методика экспертизы качества содержания теста обычно включает, три раздела, которые выстраиваются сообразно трем направлениям работы экспертов. Перед началом работы каждый эксперт должен ознакомиться со спецификацией рецензируемого теста, мнениями по его структуре, целями создания теста. Направления работа экспертов. Работа экспертов по первому направлению заключается в анализе качества содержания отдельных заданий теста. При работе по этому направлению эксперт сам выполняет весь тест, сопоставляя полученные правильные ответы с ключом ответов автора (для заданий с выбором ответа) и анализируя оценочные категории, представленные автором (к заданиям со свободно конструируемым ответом). Особое внимание следует обратить на возможную неоднозначность, когда на месте планируемого единственного ответа могут возникнуть дополнительные, частично правильные ответы. В процессе экспертизы определяется также уровень базовости содержания каждого задания, который, в определенной степени, является субъективной оценкой его трудности. Дифференциация заданий по уровням позволяет разделить их на три группы: базовые, повышенной трудности и наиболее трудные. В том случае, когда задание проверяет степень достижения требований ГОС на минимальном уровне, достаточном для выставления оценки «удовлетворителъно», оно считается соответствующим первой группе базовых. Ко второй группе относятся задания, правильное выполнение которых позволяет выставить ученику хорошие и отличные оценки. И, наконец, в третью группу включаются задания, рассчитанные на проверку творческих аспектов подготовки школьников, выполнение которых позволяет судить не только об уровне и о качестве подготовки. Эксперт оценивает уровень значимости содержания каждого задания теста и ожидаемое время его выполнения учащимся со средним, уровнем подготовленности, а также находит логически некорректные задания, нуждающиеся в коррекции. Особенно важно в процессе экспертизы выявить случаи отсутствия четкого логического выделения одного предмета измерения. Для достижения логической четкости в каждом задании следует спрашивать о чем-либо одном. Попытки проверить сразу несколько аспектов подготовленности и ввести несколько величин в ответы, как правило, отрицательно сказываются на качестве заданий и всего теста. При экспертизе также следует охарактеризовать качество формулировок заданий теста, отметить (в случае необходимости) лексическую избыточность формулировок, охарактеризовать качество представления графической информации и других компонентов заданий. Второе направление работы эксперта связано с анализом качества содержания всего теста. При выполнении работ по этому направлению эксперт должен оценить степень отображения требований, ГОС в тесте, правильность пропорций содержания теста и их соответствие спецификации теста. Простой оценки полноты охвата требований недостаточно, необходима также уверенность в том, что задания теста затрагивает все важные аспекты предметной области и в правильной пропорции. Зачастую при разработке теста возможно смещение пропорций, так как тест легко перенасытить теми разделами содержания, по которым легче составить задания. Например, в рамках гуманитарного цикла дисциплин легко разрабатывать задания на выявление фактологических знаний, и потому эти задания нередко преобладают в тестах. Третье направление работы эксперта рассчитано на подготовку обобщающих выводов и рекомендаций по улучшению содержания теста. В третьем разделе рецензии эксперт высказывает свое общее впечатление о содержании теста. Здесь должны быть представлены все сомнения эксперта и его рекомендации авторам по коррекции теста. Возможна оценка соотношения заданий, проверяющих знание теории предмета и его практики. Желательно особо отметить задания, предназначенные для проверки системы понятий, а также задания интегрального характера, позволяющие оценить умения учащихся обобщать знания по различным разделам предмета, задания с межпредметными компонентами и т.д.
|