Надёжность психологического теста

Как составляют тесты, используемые в психологии и психотерапии

Психологические тесты, используемые в психотерапии, для выявления скрытых черт характера человека и направленные на оказание помощи людям в тех оспектах, где это требуется, существуют. Конечно, чтобы их составить требуется достаточно много ресурсов и времени.

Составление теста проходит поэтапно и начинается в первую очередь с определения его целевой аудитории – лексика и сложность вопросов должны соответствовать группе опрашиваемых. Основной трудностью является максимальное раскрытие каждой из характеристик личности при помощи небольшого количества вопросов. Также зачастую помимо вопросов «по существу» в тест добавляют так называемую «шкалу лжи» — вопросы, способные помочь определить, честно и внимательно ли отвечает испытуемый. То есть это повторы одного вопроса с небольшой переформулировкой.

*Получить честные ответы также можно с помощью искаженного описания теста – опрашиваемый рассчитывая, что его проверяют на что-то одно, о другом будет отвечать правдивее.

Составление вопросов для теста, формирование инструкции и определение временных рамок являются основными этапами. Затем тест проходит проверку на надежность, то есть два варианта результата от одного человека должны быть идентичными, и на валидность – насколько тест отражает действительное положение вещей.

Особенности психологических тестов, проработанные на стадии его составления, позволяют в результате сформировать инструмент, с помощью которого можно достоверно оценить те или иные свойства клиентов или пациентов. Неудивительно, что действительно «серьезных» тестов не так много. Ведь большинство специалистов при их создании забывают или не хотят учитывать многие особенности психологического теста.

Надежность валидность стандартизация тестов. Стандартизация, надежность и валидность теста

Рассмотрим понятия стандартизации, надежности и валидности теста с позиций классической эмпирико-статистической теории. В соответствии с этой теорией конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения. В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – такой же измерительный прибор, как любой физический прибор, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет. Надежность теста. Если тест проводить много раз, то среднее значение будет характеристикой «истинной» величины параметра. Под надежностью теста принято понимать устойчивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится оценка ретестовой надежности. Чем теснее коррелируют результаты начального и повторного (обычно отсроченного на несколько месяцев) проведения теста, тем он надежнее. Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно провести путем корреляции параллельных форм или эквивалентных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна. Тест считается надежным, если коэффициент корреляции результатов составляет не менее 0,75. Валидность теста. Проблеме валидности в классической теории теста уделяется много внимания, однако теоретически она никак не решается. Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее. Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных. Существуют следующие виды валидности теста. Очевидная валидность. Тест считается валидным, если у испытуемого складывается впечатление, что он измеряет то, что должен измерять. Конкретная валидность (конвергентная – дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по содержанию, и иметь низкие корреляции с тестами, измеряющими заведомо иные свойства. Прогностическая валидность. Тест должен коррелировать с отдаленными по времени внешними критериями. Содержательная валидность. Тест должен охватывать всю область изучаемого поведения. Конструктная валидность. Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез. С теоретической точки зрения единственным способом установления «внутренней» валидности теста и отдельных заданий является метод факторного анализа (и аналогичные), который позволяет: а) выявлять латентные (скрытые) свойства и вычислять значение «факторных нагрузок» – коэффициенты детерминации свойств тех или иных поведенческих признаков; б) определять меру влияния каждого латентного свойства на результаты тестирования. Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки (подробнее об этом см. 5.2). Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.

Разбор стандартного психологического теста

Стандартные психологические тесты состоят из ряда примитивных вопросов, на которые необходимо ответить, а после просчитать баллы и прочитать к ним описание.

Стремление человека раскрыть в себе таланты, узнать что-то новое и выявить новые грани — это вполне нормально. Но зачастую люди удивляются, когда пройдя тест, его результат полностью отвечает их характеру и принципам.

;

Тесты для девушек наиболее популярны, но предпочтительнее всех те, которые отвечают на вопрос: «Нравлюсь ли я мужчинам?». Каждую девушку беспокоит данный вопрос, несмотря на то, что она сама знает на него ответ и применять в этом случае психологические тесты для девушек абсолютно ни к чему. Но все-таки, ответив на вопросы из теста, получаешь средний результат, где написано: «Вы симпатичны некоторым мужчинам, одни без ума от вас, а других немного пугает ваш характер». В целом, все сошлось: каждой женщине приятно осознавать, что она нравится мужчинам, а по поводу характера многие воспринимают это как преимущество. Если боятся, то значит самодостаточная, независимая и сильная. Также любопытно узнать результат с наименьшим количеством баллов: «Вы у мужской половины вызываете интерес, но у вас имеются некоторые комплексы, способные оттолкнуть». Такой ответ тоже является правдивым, ведь у каждого имеются какие-то комплексы. Прочитаем результат с самыми высокими баллами: «Вы способны понравится любому мужчине и покорить его», и видим, что такой ответ тоже подходит любой девушке.

Эффект Барнума

Тейлор Барнум

Вот выдержка из википедии:

Вы только что ответили на кучу вопросов личного характера и подсчитали какие-то баллы. Практически, совершили научные манипуляции по инструкциям, созданным (как хочется думать) большими учеными. Ну конечно полученный результат характеризует исключительно вас! Эффект Барнума в действии.

Этот эффект будет работать для чего угодно. И это неоднократно проверено. Впервые это было доказано в эксперименте Форера.

«Женщины по имени Маша легки на подъем и просты в общении. Но могут постоять за себя когда нужно. Они любят доверять людям. Иногда они грустят, не прочь пожалеть себя-родимую, но в общем жизнерадостны и приветливы. Из них получаются хорошие жены.»

Здесь привязка к вам идет по имени и полу. Остальное — набор ничего не значащих общих характеристик, которые подходят практически кому угодно. Если вы — женщина и вас зовут Маша, вы будете более склонны определять данное описание как подходящее вам.

Но ведь тесты работают!

Воскликнете, возможно, вы. «А как вы это поняли?» — Спрошу я. Скорее всего, вы, получив результат теста и посмотрев его расшифровку в приложении, сопоставили ее с собой. Там написано что-нибудь, что характеризует вашу личность. Вы читаете это и понимаете что это про вас. Ну или почти про вас, но довольно точно. Ишь ты! Не соблюли все эти бюрократические процедуры, а тест-то работает!

Нет, не работает. Это просто ваша оценка себя.

Если бы каждый человек мог себя адекватно оценить (желательно в цифрах), то психологические тесты были бы не нужны.

Расскажу вам о еще одной забавной вещи. Она известна как Эффект Барнума. А в народе — эффект гороскопов.

Основные характеристики, которые должны присутствовать в психологическом тесте

Психологический тест в науке – стандартизированное испытание, по полученным ответам которого можно судить и психофизиологических и личностных свойствах тестируемого.

Из этого термина стоит выделить ключевое слово – стандартизированное, что значит, что дело касается испытания, для которого имеется понятная, стандартная и строго выполняемая схема осуществления с одной стороны, и критерии оценивания результатов того, что было измерено – с другой.

Основные психометрические характеристики, которыми должен обладать тест:

  • Валидность.
  • Достоверность.
  • Адаптированность.
  • Надежность.
  • Репрезентативность.

Стоит рассмотреть каждую из вышеперечисленных характеристик более детально.

Валидность теста

Валидность теста указывает нам на то, насколько правильно выбранная методика измеряет конкретно то свойство, для анализа которого она предназначена. Это один из основных критериев оценки эффективности каждого психологического теста, потому как диагностика «не того» абсолютно бессмысленна.

Выделяют несколько видов валидности:

  • Содержательная.
  • Эмпирическая.
  • Прогностическая.
  • Концептуальная.

Достоверность психологического теста

Достоверность психологического теста указывает нам на то, насколько он защищен от умышленной фальсификации ответов тестирования испытуемым.

Достоверность психологических тестов является наиболее распространенным вопросом, особенно в случаях, когда результаты оценки свойств личности  касаются стороннего заинтересованного лица, например, руководителя.

Среди факторов достоверности теста выделяют:

  • Фактор знания. Показывает, что испытуемый знает о личностных характеристиках, скрытых за суждением, имеется ли такое поведение в реальной жизни, и как такое поведение оценивает общество;
  • Фактор социальной желательности. Для получения точной информаций в настоящем психологическом тесте должна присутствовать шкала лжи, а также возможные варианты ответов идентичной эмоциональной направленности;
  • Фактор индивидуальной практики. Речь идет о мотивации испытуемого при прохождении теста. Если при тестировании от человека требуется определенное поведение, он может давать не реальные, а желаемые поведенческие реакции, что значительно влияет на результаты.

Адаптированность

Адаптированность – одно из свойств теста, демонстрирующее, насколько его смысл и возможные результаты отвечают аудитории, для которой они предназначаются

То есть, принимаются ли во внимание национальные, культурные, и ментальные особенности людей, которые учувствуют в конкретном  исследовании. Достаточно часто игнорируется данное свойство

Даже несмотря на то, что адаптация любого иностранного тестирования – главное условие для его проведения в пределах другой страны, этим фактором часто пренебрегает, что вызывает значительные искажения при получении результатов.

Надежность психологического теста

Надежность психологического теста – наиболее важна при составлении общей картины правильного понимания результатов опроса. Она отражает внутреннюю согласованность частей теста, и воспроизводимость его результатов и конкретного испытуемого при повторном прохождение. Это значит, что построение надежных психологических тестов должно быть таким, чтобы вопросы не противоречили друг другу, а результаты определенного человека не менялись в течение некоторого времени.

Само собой, человек может меняться, но, например, если еще вчера ваш IQ составил 120, а спустя неделю – 70, скорее всего, проблема не в вашем интеллекте, а в надежности результативности используемой методики.

Репрезентативность

Репрезентативность или величина выборки стандартизации психологического теста. Такая характеристика определяет возможность применения теста относительно данной популяции опрашиваемых. Например, если тест предназначен для оценивания личностных качеств руководителя, он не подойдет для оценки личностных характеристик студента.

*Все психологические тесты направлены на выявление тех или иных качеств человека, которые могли бы приходиться в конкретной ситуации

При этом важно помнить общих тестов не бывает, все они рассчитаны на определенную группу людей. Тем не менее тесты нужны далеко не всегда и если вы честный, отзывчивый и благородный человек стремящийся делать добрые дела – судьба и так вам улыбнется

Наши поступки как бумеранг, где хорошее возвращается в двойне!

Методы оценки надежности теста;. Методы оценки надежности теста

До включения в тест задача должна быть оценена с точки зрения объективности, надёжности, валидности, трудности и дискриминативности. Объективной задача может быть признана тогда, когда она несколькими (не менее трёх) независимыми экспертами-психологами оценивается как соответствующая признаку, который подлежит измерению. Надёжной задача является, если при её повторном предъявлении она вызывает у испытуемого эквивалентную первому предъявлению реакцию. Валидной задача считается тогда, когда в соответствии с критерием она чаще всего правильно решается теми испытуемыми, у которых измеряемый признак более выражен, чем у других испытуемых. (Например, в интеллектуальном тесте валидными будут те задачи, которые правильно решают испытуемые с более высоким интеллектом, чем с более низким). Трудность задачи рассчитывается из соотношения процента правильных ответов на данную задачу с учётом объёма репрезентативной выборки испытуемых. Оптимальными для теста являются задачи, индекс трудности которых равен 50 %. Коэффициент дискриминативности, или согласованности, отдельной задачи с тестом позволяет оценить, насколько точно задача дифференцирует испытуемых по измеряемому признаку. Он равен коэффициенту корреляции между средним результатом анализируемой задачи (по принципу: правильный — неправильный ответ) и средним первичным результатом по всем задачам теста.Психологический диагноз предполагает использование и анализ результатов исследования, полученных с помощью различных методик. Причём все данные должны быть представлены в единой шкале, то есть все первичные результаты тестовых исследований необходимо преобразовать таким образом, чтобы они оказались сопоставимыми — стандартизация шкал теста.Под надёжностью теста понимается степень точности, с которой тест измеряет определённое свойство или способ поведения личности. Надёжность теста – это характеристика точности его как измерительного инструмента, его устойчивости к действию помех (как внешних, так и внутренних). Эмпирическое определение надёжности теста является обязательным условием его допуска для использования в практической деятельности психолога.В психометрике обоснование получили три метода оценки надёжности тестов:1) метод повторного тестирования (метод тест-ретест);2) метод тестирования параллельной, или эквивалентной, формой теста;3) метод деления, или расщепления теста на части. Оценка надёжности по методу повторного тестирования требует, чтобы тест дважды предъявлялся одной и той же выборке испытуемых через какое-то время. Длительность временного промежутка определяется содержанием и характером задач теста.Второй метод оценки надёжности теста требует наличия параллельной, то есть эквивалентной, формы теста, например формы «А» и «Б». Репрезентативную выборку испытуемых, на которой проверяется надёжность теста, случайным образом делят на две примерно равночисленные группы. Затем первой группе предъявляются задачи формы «А», а второй группе – задачи формы «Б». Через некоторое время (не более одной недели) задачи формы «Б» решает первая группа, а формы «А» — вторая. После этого для всей репрезентативной выборки испытуемых отдельно вычисляются первичные результаты для форм «А» и «Б», которые затем подвергаются корреляции.Общим недостатком первых двух методов оценки надёжности теста является то, что они зачастую дают заниженные или завышенные коэффициенты надёжности. Дело в том, что дисперсия результатов, на основе которой рассчитывается коэффициент корреляции, неоднородна по своему составу. Наряду с дисперсией действительных индивидуальных различий в неё входят частные дисперсии, обусловленные влиянием как внутренних, психологических, причин (колебания внимания, усталость и др.), так и внешних (уличный шум, поведение и высказывания исследователя и т. п.). При этом сила и сочетание этих причин в первом и во втором тестировании могут быть различными, и оценить их влияние или полностью их нейтрализовать оказывается невозможным.Поэтому, особенно при проверке надёжности тестов мощности (например, интеллектуальных тестов) и достижений, предпочтение следует отдавать третьему методу, поскольку он предполагает лишь однократное тестирование. Третий метод оценки надёжности включает два различных приёма расчёта: разделение тестовых задач на две части, например по принципу «чётные и нечётные», и расчёт коэффициента консистентности задач теста.

Валидность теста надежность теста. Надежность психологических тестов

В обычной жизни надежность человека или какого-либо предмета означает уверенность в том, что на него можно положиться. Как же проверяют, что на психологический тест можно положиться?

Первый способ проверки надежности психологического теста – анализ устойчивости результатов теста. Действительно, если результаты использования теста на одной и той же выборке существенно не меняются при нескольких тестированиях, то это может служить критерием его надежности.

Повторное тестирование называется ретест. Его проводят с интервалом от недели до года. Затем анализируют корреляции нескольких замеров. Если корреляции между результатами ретестов не ниже 0,76, то такой тест считается надежным.

Недостатки ретестовой проверки надежности психологического теста.

1. Некоторые психологические показатели неустойчивы и изменчивы. Например, измеряя настроение, самочувствие в разное время дня или в разные дни, можно получить разные результаты, и это не будет следствием ненадежности теста.

2. При неоднократном заполнении одного и того же теста испытуемые к нему «привыкают». Они могут помнить свои ответы и отвечать так же. Могут, наоборот, менять ответы в сторону социальной желательности. Таким образом, ретестовая надежность не будет в полной мере отражать надежность теста.

Второй способ проверки надежности психологического теста – анализ согласованности различных частей теста. Например, в тесте один показатель, который диагностируется 10-ю вопросами. Согласованность данного теста определяется высокой корреляцией ответов на каждый вопрос с общим результатом по шкале.

Часто для определения согласованности психологического теста его расщепляют на две части. Можно это сделать, отбирая вопросы через один. Можно разделить первую и вторую половину теста. Далее анализируют корреляции ответов двух расщепленных частей теста. Чем выше корреляция, тем выше согласованность теста и его надежность.

Итак, надежность психологического теста – это характеристика его формальной пригодности для диагностики психологических показателей. Например, если тест диагностики тревожности надежен, то это значит, что при его использовании на разных выборках, в разное время вы будете получать схожие результаты. Но будут ли эти результаты характеризовать именно тревожность испытуемых? Надежность психологического теста этого не гарантирует. За это отвечает другой показатель – валидность психологического теста.

Валидность психологических тестов

Валидность психологических тестов отражает соответствие их результатов сущности измеряемых психологических феноменов. Например, насколько результат теста агрессивности отражает реальный уровень агрессивности респондента.

Можно выделить два основных способа определения валидности психологических тестов.

Первый способ выявления валидности психологического теста предполагает соотнесение результатов теста с аналогичными показателями других тестов. Например, для проверки валидности теста на самооценку можно сделать следующее:

  • провести тестирование испытуемых по новому тесту;
  • выявить самооценку испытуемых по другому тесту (предполагается, что он валиден);
  • рассчитать корреляцию показателей самооценки по двум психодиагностическим методикам;
  • статистически значимая корреляция даст основания говорить о валидности нового теста.

Такой способ позволяет выявить так называемую конструктную валидность. Она отражает соответствие выявляемого психологического показателя психологическому конструкту.

Второй способ выявления валидности психологического теста предполагает соотнесение результатов теста с внешними критериями. Такая валидность называется критериальная валидность психологического теста.

Например, показателем критериальной валидности теста склонности к отклоняющемуся поведению может быть реальное число правонарушений подростка. Применительно к тесту мотивации достижений показателем критериальной валидности может быть успешность выполнения той или иной деятельности.

Способы оценки надежности теста

При определении надежности теста могут быть использованы следующие методики.

Метод повторного тестирования является одним из самых распространенных. Он позволяет установить степень корреляции между результатами исследований, а также временем, в которое они были проведены. Данная методика отличается простотой и эффективностью. Тем не менее у испытуемых, как правило, повторные исследования вызывают раздражение и негативные реакции.

Метод проверки внутренней согласованности не берет во внимание постоянство получаемых при повторном исследовании результатов. Он устанавливает взаимосвязь ответов, которые были даны в рамках одного эксперимента

Вопросы теста делятся на два перечня (по определенному принципу), после чего рассчитывается коэффициент корреляции между результатами.

Метод эквивалентных форм заключается в использовании двух или более тестов с разными формулировками заданий, но с одинаковой сутью, формой и степенью сложности выполнения. О надежности теста свидетельствуют одинаковые или приближенные результаты, которые были получены с использованием одного и того же измерительного прибора или вычислительной формулы. Если же итоги сильно расходятся, то, скорее всего, они были искажены намеренно или же испытуемый не очень ответственно подошел к процессу опроса.

Психологические тесты в интернете

Вы прочитали все что выше и теперь знаете о психологических тестах много. Куда больше чем средний человек, не имеющий отношения к психологии. Но вы наверняка смущены. Ведь вы видели огромное количество тестов. Даже на специальных психологических сайтах. И нигде не было ничего подобного.

Вот именно. И теперь вы понимаете какова цена всех этих тестов и их результатов.

Даже отличный валидный и надежный тест, переведенный в электронный вариант, меняет свои показатели. Достоверно известно, что существуют специальные эффекты для тестов, которые проводятся при помощи компьютера. Например, люди склонны отвечать что-то неопределенное или среднее (например при выборе из трех вариантов да-возможно-нет) при проведении компьютерного варианта. Разумеется это сказывается на работе теста.

Заключение

Большое количество психологических проективных тестов, с одной стороны, позволяет людям как можно лучше знакомиться с собой и своим внутренним миром, а с другой стороны, может вогнать их в состояние депрессии и апатии. Увидев неправильную расшифровку результатов, человек может подумать о наличии у себя какого-либо психического расстройства.

Важно помнить, что ни один из психологических тестов не может дать полной картины о наличии психических или эмоциональных заболеваний. Такой диагноз сможет поставить только квалифицированный специалист при проведении полноценного исследования

Поэтому не стоит относиться к тесту Сонди, как к серьезному инструменту для выявления нарушений и отклонений, – это всего лишь один из инструментов для возможного самоанализа.

Помните об этом, а мы желаем вам удачи и просим пройти небольшой опрос:

Рейтинг
( Пока оценок нет )
Editor
Editor/ автор статьи

Давно интересуюсь темой. Мне нравится писать о том, в чём разбираюсь.

Понравилась статья? Поделиться с друзьями:
Сказка или жизнь
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: