Самый известный тест достижения. История и общая характеристика тестов достижений

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Было разработано около дюжины комплексных батарей способностей для использования в образовании и при консультировании и распределении персонала. Неодинаковые по составу и методическим качествам, они сходны в одном - их характеризует низкая дифференциальная валидпость. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними - факторного анализа. Факторный анализ позволял точнее определить и классифицировать то, что называли специальными способностями. Поэтому остановимся немного на истории этого направления исследований.

Английский психолог Ч. Спирмен (1863-1945) в статье 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий генеральный фактор. Он обозначил его буквой g (g-фактор, от англ. general - общий). Помимо фактора, общего для всех видов интеллектуальной деятельности, в каждом из них при его осуществлении обнаруживается специфический фактор (s-фактор, от англ. specific - характерный, специфический), свойственный только данному виду деятельности.

Теорию Ч. Спирмена называют двухфакторной. Согласно ее положениям, целью психологического тест ирования должно быть измерение g у индивидов. Если такой фактор проявляется во всех изучаемых психических функциях, то его наличие будет единственным основанием для предсказания поведения индивида в разных ситуациях. Измерение же специфических факторов смысла не имеет, поскольку эти факторы - каждый из них - могут обнаружить себя только в одной ситуации.

Ч. Спирмен не отрицал того, что двухфакторп ля теория требует уточнения. Если сравниваемые деятельности достаточно похожи, то в какой-то степени их корреляция может быть результатом не только фактора g, но и некоторого промежуточного фактора - не столь общего, как#, но и не столь специфичного, как s. Такой фактор, свойственный только части деятельностей, был назван групповым.

Позднее распространилась точка зрения, согласно которой структуру свойств составляет ряд достаточно широких групповых факторов, каждый из которых может в разных тестах иметь различный вес. Например, вербальный фактор может иметь больший вес в тесте на словарный запас, меньший - в тесте словесных аналогий и совсем незначительный - в тесте на математическое мышление. Корреляции тестов между собой являются результатом нагруженности их групповым фактором.

Американские психологи Т. Келли и Л. Терстоун, продолжив работы факторно-аналитического направления, занялись проблемами групповых факторов. Их основные работы вышли в 20-30-е гг.

Л. Терстоун (1887-1955), основываясь на многочисленных исследованиях, выделил 12 факторов, которые он обозначил как «первичные умственные способности». Среди них можно отметить следующие:
а) словесное понимание;
б) беглость речи;
в) числовой;
г) пространственный;
д) ассоциативная память;
е) скорость восприятия;
ж) индукция (логическое мышление) и др.

Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, превышает 120.

На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известны среди них Батарея тестон общих способностей (General Aptitude Test Battery - GATB), разработанная Службой занятости США для использования консультантами в государственных учреждениях, и Батарея тестов специальных способностей (Special Aptitude Test Battery - SATB), включающая тесты способностей для конкретных профессий.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая была в 20-40-е гг. Факторный анализ - это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факторы не всегда верно отражают зависимости между психическими процессами.

Но, пожалуй, главное, что вызывает сомнение, - это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в качестве продукта влияний требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований. Но техника факторного анализа принимает эти способности как некую данность; они же в действительности суть психические образования, находящиеся в динамике.

Сказанное убеждает в том, что к возможностям факторного анализа и к его факторам нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, - тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения па эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента перехода в бостонской школе с устной формы экзаменов на письменную (1845). В Америке тесты достижений используются при отборе сотрудников на государственную службу начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение Первой мировой войны и сразу после нее.

Тесты достижений
относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэнфордский тест достижений (Stanford Achievement Test - SAT), впервые опубликованный в 1923 г.. Сего помощью в средних учебных заведениях оценивается уровень обученное™ в разных классах. Значительное число тестов специальных способностей и достижений было создано в рамках психотехники под воздействием практических запросов со стороны промышленности и экономики. Для изучения собственно психологических различий эти тесты не предназначаются. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов.

Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механи-ческих, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи (комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Было разработано около дюжины комплексных батарей способностей для использования в образовании и при консультировании и распределении персонала. Различаясь составом, методическими качествами, они сходны в одном - их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.

Экспериментально-теоретической основой для построения комплексных батарей способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними - факторного анализа. ФАКТОРНЫЙ АНАЛИЗ позволял точнее определить и классифицировать специальные способности. Поэтому остановимся немно-

го на истории этого направления исследований.

Английский психолог Чарльз Спирмен в статье 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий ГЕНЕРАЛЬНЫЙ ФАКТОР. Он обозначил его буквой G (от англ. General - общий). Помимо фактора, общего для всех видов деятельности, в каждом из них при его осуществлении обнаруживается специфический фактор, свойственный только данному виду деятельности («S-фактор»).

[Примечание. После Ч. Спирмена многие другие исследователи неоднократно подтверждали существование генерального фактора. В том числе вполне остроумно это делалось с помощью факторного анализа таблицы обыкновенных отметок учеников по разным школьным предметам (М. Рошлэн). Существование фактора «G» на этих данных пояснить очень просто: как правило, отличники (ученики с высоким G) и двоечники (ученики с низким G), отличающиеся соответственно более высокими или более низкими баллами по всем предметам, встречаются чаще, чем ученики с резко нестабильным профилем достижений - высокими баллами по одним предметам и низкими баллами по другим предметам. - Прим. научного редактора].

Позднее теория Спирмена уступила место МНОГОФАКТОРНЫМ ТЕОРИЯМ интеллекта (подробнее о теориях интеллекта см. 3.4). Выяснилось, что отдельные тестовые показатели объединяются в родственные подгруппы и за каждой такой подгруппой скрывается определенный «латентный фактор», определяющий общий уровень достижений испытуемого по всей подгруппе тестов. Причем в разные тесты один и тот же «латентный фактор» вносит разный вклад (вес, ФАКТОРНУЮ НАГРУЗКУ). Например, «вербальный фактор» может иметь больший вес в

Основы психодиагностики

тесте на словарный запас, меньший - в тесте ело-

весных аналогий и совсем незначительный - в тесте на математическое мышление. Корреляции тестов между собой являются результатом нагруженности их родственным им всем латентным фактором. Важно подчеркнуть, что факторы, которые выделялись в результате факторного анализа, не придумывались и не задавались учеными из теоретических соображений, а возникали как бы сами собой - в результате появления группировок скоррелированных тестов.

Одним из первых разработал и применил многофакторный анализ тестовых данных американский психолог Л. Л. Терстоун (основные работы вышли в 20-30-е гг.). С помощью разработанного им центро-идного метода факторного анализа, основываясь на обширном статистическом материале, он выделил 12 факторов, которые он обозначил как «первичные умственные способности» (см. 3.4). Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, "Превышает 120.

На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известны среди них Батарея тестов общих способностей (GATB), включающая тесты способностей для конкретных профессий.

Современное понимание факторного анализа вносит некоторое изменение в ту его трактовку, которая существовала в 20-40-х гг. Факторный анализ - это обобщение линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения функциональной связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще. Поэтому факторный анализ и добываемые посредством этого анализа факторы не

Психодиагностика как научная технология

всегда верно отражают зависимости между психическими процессами- В настоящее время разрабатываются более сложные алгоритмы многомерной статистической группировки тестовых данных. К возможностям традиционного факторного анализа и к выделенным с его помощью факторам современные ученые относятся с определенной осторожностью и не считают этот анализ универсальным инструментом изучения психики, а следовательно, и безошибочным базисом для конструирования психологических тестов,

Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, - ТЕСТЫ ДОСТИЖЕНИЙ- Этим термином западные тесто-логи-психометристы окрестили педагогические тесты предметных знаний - знаний по определенным учебным предметам, а также профессиональные тесты - на специальные профессиональные умения и навыки-

В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий-История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845 г.). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872 г., а с 1883 г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее. [Примечание. Наши обычные школьные контрольные работы на проверку знани^ и умений являются ничем иным, как не слишком хорошо формализованными и отработанными тестами дости-

Основы психодиагностики

жений. - Прим. научного редактора],

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных тестов достижений и широко применяемых в США до сих пор является Стэнфор-дский тест достижений (SAT), впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях.

Значительное число тестов специальных способностей и достижений было создано в рамках психотехники (индустриальной психологии) под воздействием практических запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений привело к появлению в середине XX века критериально-ориентированных тестов (см. 3.5).

В целом развитие исследований и сбор статистических данных о применении тестов в психодиагностике значительно продвинуло науку о тестах (ТЕС-ТОЛОГИЮ), которая в психологии составила ядро ПСИХОМЕТРИКИ (науки о психологических измерениях). С 1936 года в США выходит специализированный журнал «Психометрика». Другой ведущий журнал в этой области - «Образовательные и психологические измерения». В этих журналах еще до второй мировой войны и вскоре после нее выпущены ставшие классическими работы таких психометрис-тов, как Рюлон, Гилфорд, Кронбах, обосновавших, в частности, широко используемые ныне методы измерения НАДЕЖНОСТИ, ВАЛИДНОСТИ И РЕПРЕЗЕНТАТИВНОСТИ тестов (см. 2.3).

Психодиагностика как научная технология

Личностная психодиагностика

В практике профотбора психодиагностика оказалась накрепко увязанной с экономическими и прагматическими критериями, которые заставляют очень часто отдавать предпочтение весьма приближенным, но зато очень кратким и очень дешевым при проведении тестам достижений. Подобные тесты не столько дают развернутый психологический портрет тому, кто прошел отбор, сколько направлены на то, чтобы отсеять заведомо непригодных. (В самом деле, зачем измерять зрительную память у кандидата в летчики, который не проходит, например, по более значимому и информативному вестибулярному тесту?)

Таким образом, оптимальность программы психодиагностического обследования оказывается напрямую связана с иерархией измеряемых психических свойств (диагностических признаков) по уровню их информативности в контексте данной прикладной задачи. Наиболее информативные свойства (признаки), как это известно из теории информации, - это те, которые разделяют обследуемую популяцию при- * мерно поровну. Доля присутствия определенного 4 свойства в популяции называется в теории тестирования «БАЗОВЫМ УРОВНЕМ». Как отмечает А. Анас-тази (1982), при резком отклонении базового уровня от оптимального в 50 процентов инкрементная ВА-ЛИДНОСТЬ (см 2.3.) теста оказывается настолько малой, что его использование становится практически нецелесообразным - приращение точности над базовым уровнем не покрывает издержек на само проведение и обработку теста.

Но в медицине - другом важнейшем источнике социального заказа на психодиагностику - базовый уровень интересующих нас патологических отклонений от нормы по определению оказывается весьма

Основы психодиагностики

низким, резко отличающимся от 50 процентов. Вся основанная на модели НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ (см. 2.3.) традиционная «гауссовская» статистика (включая такие известные статистические инструменты, как критерий Стьюдента, коэффициент линейной корреляции Пирсона) в этом случае оказывается во многом неэффективной. В медицине задача специалиста не сводится только лишь к селекции (отделению больных от здоровых), но ему нужно получить точную «диагностическую» картину заболевания с целью определения оптимального лечения, подходящего в данном конкретном индивидуальном случае. Именно эти объективные обстоятельства и условия профессиональной деятельности обусловили развитие в области медицинской психологии второго из двух сложившихся на сегодня различных подходов к диагностике - КЛИНИЧЕСКОГО- Свое название этот подход получил именно в силу теснейшей связи с диагностической деятельностью врача.

Запросы медицинской практики дали импульс развитию методов ЛИЧНОСТНОЙ ПСИХОДИАГНОСТИКИ. Она нацелена на способности не в большей мере, чем на стилевые и мотивационные черты личности. В этой сфере используются чаще всего не тесты, а особые методы, среди которых выделяются прежде всего ОПРОСНИКИ И ПРОЕКТИВНЫЕ МЕТОДИКИ.

Опросники - это большая группа методик, задания которых представлены в виде вопросов или утверждений, а задачей испытуемого является самостоятельное сообщение некоторых сведений о себе в- виде ответов. Теоретической основой этого метода можно считать интроспекционизм - психологию самонаблюдения. Метод опросников вначале рассматривался в качестве разновидности самонаблюдения. Но при заданных вариантах ответа это самонаблюде-

Психодиагностика как научная технология

ние, которому придается стандартизированный характер, по многим формальным признакам сближается с объективным тестированием.

Прототипом личностных опросников был разработанный американским психологом Робертом Вуд-вортсом в 1919 г, «Бланк данных о личности». Этот опросник был предназначен для выявления и отсеивания с военной службы лиц с невротической симптоматикой. За прошедшие с того времени десятилетия опросники получили широчайшее распространение в качестве психодиагностического метода исследования личности. Искусная косвенная постановка вопросов, маскирующая их оценочную направленность, стандартизированная процедура предъявления и подсчета баллов во многом сблизили современные опросники с объективными тестами, основанными на объективных заданиях. Здесь речь идет скорее о тест-опросниках, а не о методе стандартизированного самонаблюдения как таковом.

Последние 50 лет самый популярный личностный тест-опросник - MMPI (Миннесотский Многофазный Личностный Перечень). Он используется преимущественно в клинической практике. Но опытные психиатры и психотерапевты обращаются с MMPI, следуя скорее логике клинического обследования, а не логике измерительного теста, а именно: профиль увязывается с результатами беседы и истории болезни, применяются скорее не групповые, а ИПСАТИВНЫЕ НОРМЫ (сравнение относительных различий по шкалам внутри результатов, полученных от данного конкретного испытуемого), больше внимания уделяется качественным, а не количественным данным и т. п.

Другим известным методом диагностики личности являются ПРОЕКТИВНЫЕ МЕТОДИКИ. Их родоначальником традиционно считается метод словесных ассоциаций, возникший на базе ассоцианистского

ОСНОВЫ ПСИХОДИАГНОСТИКИ

течения в психологии.

Возникновение метода свободных словесных ассоциаций связано с именем уже упоминавшегося выше Ф. Гальтона (1822-1911). В 1879 г. он опубликовал результаты- своих ассоциативных экспериментов. Предлагая испытуемому отвечать на слово-раздражитель первой пришедшей в голову словесной ассоциацией, Гальтон с помощью секундомера фиксировал время ответа. Позднее эта методика получила развитие в исследованиях Э. Крепелина (1892), К. Юнга (1906), Г. Кента и А. Розанова (1910) и других.

Как интерпретируются результаты этой методики? Большинство исследователей сегодня склонны рассматривать ассоциативный эксперимент в качестве приема для изучения интересов и установок личности. Однако следует отметить, что интерпретация получаемых результатов определяется теоретическими взглядами исследователей. Поэтому вопрос о валидности методики (их однозначной настройки на измерение определенного психического свойства) не может быть решен однозначно вне соотнесения с теоретическими позициями ее разработчиков и пользователей.

Ассоциативный эксперимент стимулировал появление такой группы проективных методик, как «неоконченные предложения» (или «завершение предложений»). Впервые для изучения личности «завершение предложений» было использовано А. Пейном в 1928 г.

Кроме ассоцианизма теоретические истоки проективных методов можно искать в, психоанализе, ставящем во главу угла понятие бессознательного. Бессознательное принималось первоначально как.скрытый двигатель личности, мотив, слепо действующий из таинственных глубин организма. Разум, по отношению к бессознательному, служит лишь маскировочным механизмом. Для того, чтобы пси-

Психодиагностика как научная технология

хологу прорваться в область бессознательного, понять скрытые в нем тенденции, необходимо в "эксперименте направить сознание на решение особых заданий, которые позволили бы непроизвольно проявиться бессознательному в особой проективной продукции - бессюжетных словесных ассоциациях, сюжетных фантазиях, образах, выраженных в рисунках (как это делается в рисуночных проективных методиках) и т. п. Такого типа задания и включались в проективные методики.

Одна из самых популярных проективных методик была разработана в 1921 г. швейцарским психиатром Германом Роршахом, который, кстати, одним из первых ввел в обиход термин «психодиагностика». Создавая эту методику, Роршах экспериментировал с большим количеством чернильных пятен, которые он предъявлял различным группам психически больных людей. В результате своих наблюдений Роршах постепенно объединил те характеристики ответов, которые можно было соотнести с различными психическими заболеваниями, в относительно стройную систему показателей. В дальнейшем эта методика использовалась и анализировалась многими исследователями как за рубежом, так и у нас в стране.

Еще одна из старейших и наиболее распространенных в мире проективных методик - Тест тематической апперцепции (ТАТ) - была создана в США в 1935 г. X. Морган и Г. Мюрреем (см.2.5).

Завершая краткий обзор истории развития и становления психологической диагностики на Западе, отметим, что она отличается широким разнообразием используемых методик как в отношении формы, так и их содержания. Возникновение психологической диагностики вызвано требованиями практики, а развитие направлено на удовлетворение ее требований. С этим связано появление не всегда теоретичес-

Основы психодиагностики

ки обоснованных, но методически совершенных приемов и способов диагностирования.

Одновременно с обилием новых лабораторных разработок для практической западной психодиагностики после второй мировой войны стал характерным определенный консерватизм, выражающийся в приверженности к работе с немногими тестами, которые прошли серьезную многолетнюю психометрическую адаптацию, по которым собраны десятки тысяч протоколов, выполнены сотни и тысячи диссертационных работ (по проверке этих тестов на особых контингентах испытуемых и в особых условиях, созданию парциальных тестовых норм, дополнительных шкал и т. п.). Любому новому тесту, каким бы он ни был передовым в научном отношении, в этих условиях очень трудно конкурировать с «классическими» методиками, по которым накоплена огромная методическая литература. Даже новые компьютерные тесты, обладающие массой объективных достоинств (например, гибкими возможностями настройки на конкретного испытуемого - свойствами так называемого АДАПТИВНОГО ТЕСТИРОВАНИЯ), с трудом пробивают себе дорогу и до сих пор не могут сравниться в популярности с «классическими» методиками. Не случайно многие образцы современных компьютерных тестов являются не более, чем компьютерными версиями существовавших до них буклетных, или «карандашно-бумажных», методик.

Медленно завоевывают себе приверженцев на Западе и такие новые научные направления в области личностной психодиагностики, порожденные опять же компьютерной революцией второй половины XX века, которые основываются на комбинации методов стандартизированного опроса и проективных техник. Это прежде всего техники семантического шкалирования (Ч. Осгуд,1952; Дж. Келли, 1965), позволяю-

Психодиагностика как научная технология

щие в результате компьютерной многомерной обработки данных реконструировать так называемые «субъективные семантические пространства» (см. 2.4).

Тест достижений – это группа психодиагностических методик, направленных на оценку достигаемого уровня развития навыков и знаний.

2 группы тестов достижений :

· Тесты успешности бучения (используются в системе образования)

· Тесты профессиональных достижений (тесты диагностики специальных знаний и трудовых навыков, необходимых для выполнения профессионально-трудовых действий).

Тест достижения противоположен тесту способностей. Различия: между этими тестами существует различие в степени единообразия предшествующего опыта, который и диагностируется. Если тест способностей отражает влияние совокупного разнообразного опыта, получаемого учащимися, то тест достижений отражает влияние относительно стандартного курса обучения чему-то.

Цель применения тестов способностей и тестов достижений :

· тесты способностей – для предсказания различия успешности выполнения деятельности

· тесты достижений – делают конечную оценку знаний и навыков по завершении обучения.

Классификация тестов достижений.

Широкоориентированные – для оценки знаний и навыков, соответствие основным целям обучения (рассчитанным на продолжительное время). Например: тесты достижений на понимание научных принципов.

Узкоспециализированные – усвоение отдельных принципов, отдельных или учебных предметов. Например:

Как конструировать тесты достижений?

1. Тест достижений состоит из заданий, которые отражают определенную область содержания курса обучения. Сначала нужно спланировать тему содержания, выявить важные темы в курсе обучения. В конструировании теста достижений должен участвовать учитель, который преподавал темы. Психодиагност должен знать основные темы.

2. Исключить из задания второстепенные знания, малосущественные детали. Желательно, чтобы выполнение заданий в малой степени зависело от механической памяти ученика, а зависело от понимания, критической оценки ученика.

3. Задания должны быть репрезентативны целям обучения. Есть цели обучения, успешность усвоения материала, по которым сложно оценить (например, усвоение темы о правах), тогда нужно составлять задания так, чтобы отразить усвоенность материала.

4. Тест достижений должен полностью охватить ту область учебного предмета, который должен быть изучен. Задания должны быть широко репрезентативны этой изучаемой области.

5. Тестовые задания должны быть свободны от посторонних затрудняющих элементов, не должно быть затрудняющих элементов, не должно быть дополнительных трудностей.

6. Каждое задание сопровождается вариантами ответов.

7. Задание должно быть четко, кратко, недвусмысленно сформулировано. Чтобы ни одно задание не было подсказкой на другое задание теста (проверить после составления).



Ответы должны быть построены так, чтобы исключить возможность напоминания ответов (то есть не давать не относящихся к теме варианты ответов или очень легкие, чтобы испытуемый не смог догадаться, отбросив варианты ответов, как заведомо неприемлемые).

8. Задается критерий выполнения. Психолог разрабатывает большое число заданий, не все они войдут в тест. Для начала все задания проходят проверку. Войдут в тест те задания, которые решаются стопроцентным большинством людей, которые хорошо владеют материалом. Вторая проверка на тех, кто не владеет материалом – они должны выполнить меньше половины. Задания составляются по максимальному критерию. 90-100% - высокий уровень обученности. Тест достижений не оценивается по сопоставлению со статической нормой, а с классом. Сопоставляется индивидуальный результат.

История создания и общая характеристика тестов достижений. Примеры наиболее известных методик. Широкоориентированные тесты достижений (батареи общих достижений), тесты достижений по конкретным учебным предметам. Тесты академической оценки SAT I, SAT II, ЕГЭ .

История создания тестов достижений

Этим термином западные тестологии обозначили педагогические тесты предметных знаний - знаний по определенным учебным предметам, а также профессиональные тесты - на специальные профессиональные умения и навыки.

В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного индивидуального опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий. (Обычные контрольные работы в наших школах являются, по сути, ничем иным, как не слишком хорошо формализованными и отработанными тестами достижений).

История развития этих тестов начинается с момента смены в Бостонской школе устной формы экзаменов на письменную (1845г.). В Америке тесты достижений используются при отборе сотрудников на государственную службу, начиная уже с 1872г., а с 1883г. их применение становится регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений выполнена в течение первой мировой войны и сразу после нее.

Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных тестов и наиболее применяемых в США является Стенфордский тест достижений (SAT), впервые опубликованный в 1923г. С его помощью оценивается уровень обученности в разных классах в средних учебных заведениях.

Значительное количество тестов было создано в рамках индустриальной психологии (психотехники) под воздействием запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений:

Первой попыткой введения стандартизированных методов тестов успешности была работа английского школьного учителя Фишера составившего в 1869г. «Книгу шкал», в которой приводились образцы различных ученических работ, расположенные по возрастающей степени совершенства шкал. Сравнивая работы данного ученика с приведенными в книге образцами педагог мог дать более точную и объективную оценку достижений ученика и вместе с тем мог указать какой стадии обучения по данной шкале соответствуют данные достижения. Широкого распространения метод Фишера не получил. Причиной этого была примитивность предложенных им шкал и не возможность более обстоятельной разработки их вследствие отсутствия соответствующих статистических методов. Для построения более совершенных шкал необходимо было перейти от простого коллекционирования школьных работ к собиранию их при помощи испытаний при строго определенных, однообразных условиях и затем установить стандарты, обосновав их путем соответствующей статистической обработке собранного материала.

Первым, кто начал разрабатывать стандартизированные тесты учета школьной успешности был американский педагог Райс. Первой его работой в этой области было исследование навыка учащихся в орфографии (1894-1895г.) Желая точно учесть успешность учащихся в орфографии при различных методах обучения он составил специальные таблицы слов, написание которых учащимися представляло наибольший интерес с точки зрения обучения, и обследовал по этим таблицам свыше 60 000 школьников.

Он сделал интересные замечания на основе данных исследования – ученики, тратившие в течение 8 лет в среднем по 40 минут в день на занятия орфографией, пишут не лучше, чем ученики, занимавшиеся орфографией в течение того же времени в среднем по 10 минут в день.

Возможность измерения школьных достижений с помощью специальных заданий после публикации Фишера вызвала бурную дискуссию среди педагогов. Вслед за тестами для орфографии Райсом были составлены тесты для учета навыков в счете и языке. При этом Райс, прежде всего, ставил целью оценку методов обучения, Ане определение стандартов (норм).

Совершенно определенно вопрос о стандартах впервые поставил Торндайк, которого современные авторы называют отцом стандартизированных методов учета. Заинтересовавшись школьными тестами в 1903г. Торндайк особое внимание обратил на психологическое и статистическое обоснование метода тестового учета и на тщательную статистическую обработку получаемого с помощью этого метода материала. В течение ряда лет им был разработан ряд ценных тестов по учету навыков в чтении, письме и счете, послуживших образцом для позднейших исследователей, и дан ряд стандартов для различных годов обучения. Его капитальные работы по методике психологических и педагогических измерений «Mental and Social Measurements», «Educational Psychology» подвели научную базу под стандартизированные методы учета, а вышедшая в 1922г. книга «Психология арифметики» является образцом изучения процесса школьной работы на основе объективных методов измерения успешности.

Вслед за Торндайком к разработке объективных методов учения успешности при помощи тестов преступил целый ряд других психологов: в США - Кортис, Старг, Эйрис, Мкколл, Монро, Вуди, Требю и др. В Англии - Берт, Баллард. В Австрии - Раншбург.

В 20 годы 20 века в США были организованы при университетах и администрациях в педагогических центрах ряд специальных исследовательских бюро, которые занимались разработкой стандартизированных методов учета, руководили проведением учета и обработкой получаемых результатов. Метод стандартизированного учета школьной успешности получил широкое распространение в Америке, им пользуются и психологи, и педагоги, и методисты для:

  1. оценки методов обучения
  2. учета эффективности работы педагога
  3. изучения индивидуальных особенностей учащихся
  4. анализа работы школ.

Было разработано большое количество разнообразных форм тестов достижений.

Общая характеристика

Тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, в них основной интерес сосредоточен на том, что индивид может делать к настоящему времени.

Таким образом, тесты достижений предназначаются для определения соответствия достижений некой идеальной общенациональной учебной программе (часто основанной на обобщении материала различных учебников).

Выделяют две группы тестов достижений: широкоориентированные тесты достижений (батареи общих достижений), тесты достижений по конкретным учебным предметам.

Широкоориентированные тесты достижений ориентированы на оценку навыков по основным целям обучения (например, тесты на понимание научных принципов). Батареи общих достижений представляют собой широко ориентированные тесты, они применяются для оценки достижений главных, долгосрочных целей обучения. Разработка таких батарей широко применяется в образовательной практике США. Большинство тестовых батарей охватывают все уровни школьного обучения и являются скоординированной серией тестов,позволяющей сопоставить результаты учащихся от 1 до 12 класса. Такую серию например составляют Тесты академической оценки SAT

Тесты достижений по конкретным предметам (достижения в чтении и математике) ориентированы на оценку усвоения элементов учебных программ, конкретных тем, уровня владения навыками (например, счетными).

Стандартизированные тесты по отдельным учебным предметам измеряют уровень достижений в предметных областях знаний, изучаемых в школе и колледже. Применений таких тестов существенно возрастает в связи с тем, что современные школьники специализируются на изучении конкретных научных дисциплин.

В США стандартизированные тесты разработаны почти по каждому предмету: от истории до физической культуре. Такие узко ориентированные тесты используются в качестве итоговых экзаменов по курсу обучения. Также они выполняют не менее важную функцию – определение «сильных» и «слабых» сторон в усвоении предметно-специфических навыков и знаний. Постепенно возрастает использование специализированных тестов достижений в качестве замены вступительных экзаменов в колледжи и университеты.

Такие тесты выполняют несколько функций:

  • выступают как средство оценки знаний,
  • выявляют недостатки обучения,
  • подсказывают направление последующего обучения,
  • обеспечивают мотивацию учащегося,
  • помогают приспособить обучение к потребностям индивида,
  • дают информацию об уровне знаний, усвоенных учащимися.

Особое место среди стандартизированных тестов достижений занимают тесты оценки уровня базовых навыков, используемые в качестве средства подтверждения образовательного минимума и как основы для выдачи аттестата об окончании средней школы. Неоходимость разработки и применения такого рода тестов США была инициирована докладом «Нация в опасности», представленным Национальной комиссией улучшения образования. В нем утверждалось, что американская нация стоит перед непосредственной угрозой снижения общего образовательного уровня. В связи с этим докладчики настаивали на введении минимального тестового стандарта, общей тестовой батареи, на основе которой будет устанавливаться минимальный уровень школьной успешности.

Тесты на минимум базовых навыков разрабатываются и для взрослых в связи с реализацией образовательных программ в учреждениях особого типа (например, в тюрьмах) и обеспечением эффективности программ профессиональной подготовки. Пример: Тесты базового образования взрослых TABE. Батарея TABE содержит 5 ступенчатых уровней трудности для 5 предметных областей, включая чтение, язык и прикладную математику.

Для понимания различий между педагогическими и психологическими тестами необходимо ввести понятие тестов достижений и тестов способностей. Среди всех типов стандартизованных тестов тесты достижений численно превосходят все остальные. Они создавались для измерения эффективности программ и процесса обучения. Именно этот тип тестов в общем смысле ассоциируется с названием «педагогический тест». Тесты достижений принято противопоставлять психологическим тестам способностей, состоящим из тестов общего интеллекта, комплексных батарей способностей и тестов специальных способностей. А. Анастази считает, что «с определенной точки зрения, различия между тестами достижений и способностей есть различия в степени единообразия соответствующего предшествующего опыта. А это значит, что тесты достижений измеряют влияние относительно стандартизованного курса обучения, такого как курс биологии, физики или программирования. В отличие от тестов достижений выполнение тестов способностей отражает совокупное влияние разнообразного опыта повседневной жизни». Можно сказать, что тесты способностей измеряют эффективность обучения в относительно неконтролируемых и неизвестных условиях, в то время как тесты достижений измеряют эффективность обучения при частично известных и контролируемых условиях.

Другим отличием тестов способностей от тестов достижений являются цели их использования. Тесты способностей предоставляют некоторый срез психологических данных, на основе которых прогнозируется выполнение той или иной деятельности и делается предположение о возможных достижениях в новой ситуации. Результаты тестов способностей содержат информацию, позволяющую произвести оценку целесообразности прохождения индивидом специальных курсов обучения. Напротив, тесты достижений обычно дают конечную оценку достижений индивида по завершении обучения, в них основной интерес сосредоточен на том, какой информацией индивид владеет и что может делать к настоящему времени. Эта разница между тестами, пожалуй, лучше всего видна, когда оценивается их валидность. Лучший способ оценить тесты способностей – это осуществить прогностическую, критериально ориентированную валидацию, тогда как тесты достижений в основном оцениваются в терминах валидности по содержанию.

Тем не менее, нужно признать, что различия между тестами способностей и достижений не столь однозначны. Некоторые тесты способностей могут отражать достаточно конкретную и единообразную предшествующую образовательную программу, а тесты достижений – охватывать относительно широкий нестандартизованный курс обучения и использоваться в качестве вероятностной информации о возможностях предстоящего обучения. В сущности, тесты достижений служат тем же целям, что и тесты способностей. Скажем, успехи ученика по математике были определены по его показателю в тесте достижений, который можно затем использовать для прогнозирования его успехов в алгебре.

При рассмотрении различий между тестами способностей и достижений не следует думать, что тесты достижений измеряют эффективность обучения, а тесты способностей – врожденные, не зависящие от обучения способности. Столь ошибочное суждение было достаточно распространено на заре психологического тестирования, но в значительной степени пересмотрено при уточнении смысла используемых в психометрии понятий. Без сомнения, все психологические тесты измеряют наличное поведение индивида, а оно неизбежно отражает воздействие прошедшего обучения. Тем не менее, факт, что каждый тестовый показатель связан с «прошлым», не устраняет его связи с «будущим».

Важное отличие психологических тестов от педагогических видится в том, что при составлении первых исследователи стараются учесть предрасположенность учеников к различным видам репрезентативных систем (визуалы, аудиалы, кинестетики) и различные типы интеллекта (вербальный, логический, пространственный и т.д.). К сожалению, в педагогике возможности такого учета значительно ограничены, во-первых, преобладанием в школе знаково-логической визуальной информации, направленной на развитие соответствующих типов интеллекта. Как правило, от учеников требуется воспроизведение рационализированной и вербальной (письменной или устной) информации о фактах. Поэтому часто дети с более развитыми пространственными способностями выглядят неуспевающими, а дети с более развитыми по сравнению с пространственными вербальными способностями кажутся необыкновенно талантливыми.

Многочисленные функции тестов достижений давно признаны в образовании. Как средство выставления оценок подобные тесты хороши своей объективностью и единообразием. Если они должным образом построены, то обладают и другими достоинствами: их содержание адекватно изучаемому предмету, они сводят на нет в процедуре оценивания действие случайных факторов. Тесты достижений составляют также важный компонент корригирующих программ обучения, поскольку их можно использовать как для выявления учащихся, не способных к отдельным видам обучения, тан и для измерения успехов в выполнении корригирующих программ.

При всех типах обучения периодическое применение правильно построенных и соответственно подобранных тестов достижений облегчает этот процесс. Такие тесты выявляют недостатки прошлого обучения, подсказывают направление последующего и обеспечивают мотивацию обучающегося. Побудительную силу знания своих результатов неоднократно выявляли психологические эксперименты с самыми разнообразными ситуациями обучения: варьировали возраст испытуемых и их образовательный уровень. Эффективность такой самопроверки обычно сказывается немедленно. Поэтому, когда проверка достижений применяется главным образом как средство обучения, желательно, чтобы учащиеся узнали о допущенных ошибках как можно раньше.

Кроме того, тесты достижений помогают приспособить курс обучения к потребностям индивида. Учение происходит более плодотворно, когда начинается с той стадии, на которой уже находится обучающийся. Проведение тестирования в начале учебного года позволяет предпринять конструктивные шаги по ликвидации обнаруженных при выполнении тестов основных пробелов в знаниях учащихся.

Особенно важно в связи с этим видеть многочисленные условия, влияющие как на выполнение теста, так и на школьное обучение, в том числе кумулятивное влияние предшествующего и настоящего жизненного опыта, приобретаемого вне школьной среды.

Так, интеллект часто связывается с развитыми логико-математическими способностями или высокой осведомленностью человека. Но сегодня такая трактовка представляется явно упрощенной и ограниченной. Интеллект – это наша способность успешно реагировать на новые ситуации и учиться на опыте (Г. Гарднер). Возможности творческого развития человека и успешность будущей профессиональной и жизненной адаптации детерминируются с развитием семи видов интеллекта.

1. Вербальный интеллект – это способности, предполагающие умение аргументировать, убеждать, беседовать, поддерживать и учить с помощью речевых навыков. Этот вид интеллекта просто необходим журналистам, адвокатам, писателям, учителям. Тренировка вербального интеллекта успешно происходит в операциях чтения, письма, сочинительства и в процессе публичных выступлений (дискуссий, монологов, задавания вопросов и ответов на них).

2.Логико-математический интеллект – умение проводить операции с числами и логикой, способность думать в понятиях причины и следствия, формулировать тезисы, развивать концепции, анализировать, классифицировать и обобщать.

3.Пространственно-визуальный интеллект этот вид интеллекта работает в образах, метафорах и пространственных представлениях. Люди с развитым пространственным интеллектом отличаются наблюдательностью, способностью легко ориентироваться на местности и в незнакомой среде, предпочтением выражать свои идеи графически. Этот вид интеллекта является основой профессиональной деятельности архитекторов, фотографов, художников, скульпторов, пилотов, механиков, инженеров.

4.Музыкально-ритмический интеллект связан со способностью человека к восприятию ритмов и мелодий, гармонии и дисгармонии, запоминанию музыкальных интонаций, ладов и звукосочетания.

5. Телесно-кинестетический интеллект – интеллект нашего тела. К нему относятся: способность контролировать движения, ловко оперировать частями тела, способность развивать и сохранять физические качества. К сожалению, в учебном процессе этим интеллектом недопустимо пренебрегают.

6.Межличностный интеллект – под этим понимается способность осуществлять коммуникацию, вступать во взаимодействие с людьми, понимать, чувствовать и учитывать уникальность каждого, а также умение адекватно предъявляться, без попытки спрятаться за других, за свои проекции, шаблоны, стереотипы. Развитие этого интеллекта возможно лишь в условиях интерактивного обучения.