НГ - НАУКА
№ 8 (12) [2 IX 1998 г.]
© "НГ-Наука"
НУЖНО ЛИ РОССИЮ ТЕСТИРОВАТЬ?

Распространять данную процедуру на все население страны преступно
и - что еще хуже - ошибочно

Сергей Давидович Хайтун
кандидат физико-математических наук,
старший научный сотрудник Института истории естествознания и техники РАН.

Россия в очередной раз хочет быть впереди планеты всей. Министр общего и профессионального образования РФ Александр Тихонов собирается всех "посчитать" - готовится решение о поголовном тестировании абитуриентов при приеме в учебные заведения. Все мы учились, учимся или будем учиться, так что практически все население страны планируется пропускать через эту процедуру.

Звучит, конечно, интересно и даже в некотором роде научно, но это только на первый взгляд. От реализации этого проекта произойдет большой вред, как когда-то от внедрения кукурузы. Как всегда, когда чиновников охватывает реформаторский зуд, не отвечающий уровню их компетентности.

Автору эти строк принадлежат две монографии по количественным методам анализа науки: "Наукометрия: состояние и перспективы" (М.: Наука, 1983), "Количественные методы анализа науки" (М.: Наука, 1989). В них, в частности, показана глубокая некорректность процедур тестирования, принятых сегодня у нас и за рубежом. Изложу суть дела "на пальцах".

При тестировании человеку задают определенное количество вопросов. За ответы на них выставляют баллы, которые затем складывают или усредняют с получением итоговой оценки. Скажем, выведение суммарного экзаменационного балла для сравнения с проходным баллом - это уже своего рода тестирование.

Величины, значения которых можно складывать, называются аддитивными (от англ. addition - сложение). На сложении базируются вычитание, умножение и деление, поэтому с неаддитивными величинами не могут производиться эти и другие количественные операции. Но именно таковы баллы, используемые сегодня при тестировании. Неаддитивна школьная отметка. Почему?

Тестирование - это разновидность измерения. В измерении участвуют величины двух типов. Латента (от англ. latent - скрытый) - это то, что мы хотим измерить. Скажем, "ум", "интеллект" или "уровень знания" данного предмета. Никто на самом деле не знает, что такое ум или интеллект, так что измерить саму латенту нельзя. Поэтому при измерении находят значения ее индикатора, в качестве которого и выступает отметка или балл.

Некоторые латенты имеют качественное содержание. Скажем, латента "запах" имеет значения "горький", "соленый" и т.д., которые не имеет смысла складывать. Но допустим, что наша латента аддитивна. Для того чтобы ее индикатор был таким же, его значения не должны быть деформированы относительно значений латенты. Этому требованию и не удовлетворяют баллы, используемые при тестировании.

В самом деле, значения латенты - ума или интеллекта - ограничены сверху только матушкой природой. Достаточно очевидно, скажем, что Эйнштейн был в сотни или тысячи раз умнее среднего индивида. Между тем балл "для удобства" принято ограничивать сверху некоторым произвольным значением - 3, 5, 10 и т.д. Например, в школах России используется пятибалльная шкала, которая часто применяется и при тестировании. При этом самая высокая отметка (5) превышает среднюю (в районе 3,5) всего лишь в 1,4 раза.

Введение верхнего порога значений индикатора ведет к деформации всех его значений. Эта деформация носит неопределенный характер, так как о латентах практически ничего не известно. Определенно можно сказать одно - эта деформация тем больше, чем о больших значениях индикатора идет речь. То есть чем более талантливый человек тестируется, тем менее он характеризуется получаемым им баллом или отметкой. Деформация и делает баллы неаддитивными.

Таким образом, школьные отметки напрочь лишены количественного смысла. Скажем, вы учитесь в одном классе с будущим Эйнштейном. Вам поставили по физике тройку, будущему Эйнштейну - пятерку. Но это вовсе не значит, что он владеет предметом только в 5/3=1,66 раза лучше; он может превосходить вас в данном отношении в тысячи раз.

Точно так же лишены количественного смысла и баллы, используемые при тестировании. Если же, пренебрегая этим, их складывать и усреднять, получаемая итоговая оценка не будет говорить ровным счетом ни о чем. Эта оценка не будет даже приближенной, поскольку абсолютно неизвестна степень ее достоверности в том или ином конкретном случае из-за неуловимости латенты. Она вообще не будет характеризовать жертву тестирования. Нельзя складывать нескладываемое. Это - табу.

Надо сказать, что сегодня это табу хладнокровно игнорируется. Тестирование широко распространено на Западе, хотя и не так масштабно, как это задумано российскими чиновниками. При этом "туземные" процедуры тестирования ничуть не корректнее наших.

Например, на Западе часто используется коэффициент интеллекта IQ. Его получают традиционно - сложением или усреднением баллов, ограниченных сверху. Это можно видеть из того, что ситуация с IQ подобна ситуации со школьными отметками. А именно: максимальное его значение превышает среднее только в 1,5 раза или около того, тогда как максимальный интеллект превосходит средний, конечно же, не в полтора раза, а существенно более. Чтобы тестирование стало корректным, нужно развернуть шкалы баллов, так чтобы верхние их значения могли быть сколь угодно велики. Эта простая на словах, но сложная в исполнении операция сделает корректными экзаменационные баллы, коэффициент интеллекта и все тестирование. Однако здесь, что называется, еще конь не валялся.

В физике разработка измерительных шкал занимала в отдельных случаях сотни лет. Так было, например, с измерением температуры. Социальное измерение требует не меньшего труда. Мы живем, конечно, в конце XX века, однако и сегодня на доведение тестирования до ума потребовались бы годы концентрированных усилий.

Я не понимаю, почему некорректные математические процедуры при расчете самолета или бормашины применять нельзя, а на живых людях - можно. Потому что неверно рассчитанная бормашина "даст по зубам", а жертва тестирования этого пока не делает? Применение некорректных процедур тестирования на многих миллионах людей приводит к столь же массовым ошибкам, потерям и личным трагедиям, которые незаметны просто из-за отсутствия средств контроля за результатами тестирования. Более всего страдают при этом как раз талантливые люди и гении, в интересах которых, казалось бы, и задумано тестирование.

Распространять тестирование на все население России, на мой взгляд, просто преступно и - что еще хуже - ошибочно. Уверен, что до разработки корректных процедур тестирования его не следует применять вовсе.

Бюджет страны трещит по швам, учебные заведения разваливаются в буквальном и переносном смысле, преподавателям задерживают зарплату. А здесь задумывается вредная процедура, которая, помимо прочего, обойдется налогоплательщикам в десятки и сотни миллионов рублей!

Этот случай проявления чиновниками дурной инициативы далеко не единственный. Удвоив за последнее десятилетие свою численность, российское чиновничество положительно не знает, чем себя занять. Тем временем рыночные реформы, проведение которых является его прямой обязанностью (именно чиновники управляют страной), стоят на месте.


Любезно предоставлено редакцией ЭВНГ

VIVOS VOCO! - ЗОВУ ЖИВЫХ!