Конструктная валидность
Конструктная валидность (исследования)
(construct validity (study)— точность теоретической интерпретации результатов исследования.
Источник: Миллер С. Психология развития, методы исследования. 2002
Конструктная валидность (теста)
(construct validity (of test)) — одна и форм валидности теста, которая зависит от того, в какой мере разного рода данные подтверждают обоснованность теоретической интерпретации из меряемого атрибута.
Источник: Миллер С. Психология развития, методы исследования. 2002
Конструктная валидность
Construct validity). Доказательство того, что тест измеряет определенный гипотетический конструкт; предполагает валидизацию как самого теста, так и тех характеристик, которые предположительно связаны с рассматриваемой концепцией.
Источник: Хьел Л., Зиглер Д. Теории личности. 2003
Валидность конструктная
один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать например практический или вербальный интеллект, эмоциональная неустойчивость, понимание речи, переключаемость внимания и т. д.
Источник: Основные понятия психодиагностики и экспериментальной психологии. Cловарь 2006
Конструктная валидность
construct validity). В измерениях — присутствует при точном оценивании некого гипотетического конструкта с помощью выбранной единицы измерений. Также показывает, является ли валидным сам конструкт. В исследованиях показывает валидность операциональных определений, использованных для независимых и зависимых переменных.
Источник: Гудвин Дж. Исследование в психологии методы и планирование. 2004
Валидность конструктная
лат. constructio – построение) – набор процедур для оценки валидности инстумента тестирования, основанных на определении степени, в какой пункты теста отражают то гипотетическое свойство или черту (то есть конструкт), для измерения которой они были разработаны. Начальные стадии разработки теста обычно имеют отношение к конструктной валидности, поскольку нужно прежде выяснить, а) какие черты фактически характеризуют это качество и б) действительно ли пункты теста регистрируют это качество.
Источник: Жмуров В.А. Большая энциклопедия по психиатрии. 2012
ВАЛИДНОСТЬ, КОНСТРУКТНАЯ
Набор процедур для оценки валидности инструмента тестирования, основанных на определении степени, в которой пункты теста отражают то гипотетическое качество или черту (то есть конструкт), для измерения которой они были разработаны. Таким образом, например, если предполагается, что тест обеспечивает измерение интеллекта, нужно выяснить: (а) какие черты или качества (конструкты) фактически характеризуют интеллект и (б) действительно ли пункты теста регистрируют это качество? Начальные стадии создания теста обычно имеют отношение к конструктной валидности. Обратите внимание, что это не дает ни количественного, ни статического измерения валидности. В отличие от измерений, которые зависят от корреляции валидности, здесь нет никаких математических оснований для определения валидности, и в отличие от измерений, которые зависят от известных паттернов поведения (например, критериально определяемой валидности), оценка конструктной валидности всегда изменяется с накоплением сведений о тех чертах и качествах, которые лежат в основе этого конструкта. См. содержательная валидность, одной из форм которой является данный тип валидности.
ВАЛИДНОСТЬ КОНСТРУКТНАЯ
один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная
неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Иначе, В. к. определяет область теоретической структуры психологических явлений, измеряемых тестом.
Поскольку проявления конструктов в деятельности человека многообразны и неоднозначны с т. з. их выделения, процедура установления В. к. по сравнению с валидностью критериальной или валидностью содержательной сложна.
При объяснении связи полученных тестовых результатов с теоретическим конструктом необходимо постепенное накопление разнообразной информации о динамике развития измеряемого свойства, а также его взаимодействии с другими психологическими явлениями.
Среди конкретных методов характеристики В. к. в первую очередь необходимо назвать сопоставление исследуемого на предмет В. к. теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по
конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, психологическое качество, что и эталонная методика. Такая процедура валидизации напоминает определение критериальной валидности
в том смысле, что эталонный тест, валидность которого определена, выступает в качестве независимого критерия.
Следует однако заметить, что в отличие от критериальной валидизации при анализе В. к. не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию и результатам, и разрабатываемая
методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с т. з. создания параллельной формы теста. Смысл процедуры В. к. состоит в установлении одновременно как сходства,
так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.
При анализе В. к. методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широким кругом других тестов, направленных на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми.
При этом В. к. характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где исходя из гипотезы, значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная (проверка степени
близости прямой или обратной связи) и дискриминантная (установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений В. к. В зарубежной психодиагностике такое операциональное
определение В. к. носит название «предполагаемой валидности» (assumed validity).
Прямое отношение к характеристике В. к. имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы
сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид В.
к.— факторную валидность.
Важным аспектом В. к. является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же
конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста. Следует отметить, что критерий внутренней согласованности указывает лишь на меру связи всего содержания
теста с измеряемым конструктом, не давая информации о природе измеряемого свойства.
При определении В. к. важное место принадлежит изучению динамики измеряемого конструкта. Идентификация конструкта может опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов
является применение критерия возрастной дифференциации (см. ВАЛИДНОСТЬ ПО ВОЗРАСТНОЙ ДИФФЕРЕНЦИАЦИИ), предусматривающей согласование изменений результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство
в возрастной динамике при переходе на новые этапы развития. Этот метод В. к. особенно важен для валидизации тестов интеллекта, достижений в обучении.
В комплекс сведений о В. к. методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, являются важной информацией для раскрытия области поведения, качества, представленных
в тесте в виде конструкта. Для характеристики В. к. необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако В. к. является качественно более высоким и комплексным уровнем описания теста, характеризуя
область измеряемого поведения в широких психологических понятиях. Благодаря данным В. к. мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических
категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.
В качестве примера, иллюстрирующего необходимость глубокого анализа теоретического конструкта, лежащего в основе конкретной методики, правильного применения теста и интерпретации его результатов, можно привести сопоставление двух популярных опросников
личностных «Проявления тревожности» шкалы (MAS) и варианта Айзенка личностных опросников EPI. Корреляционные исследования показывают, что шкала «тревожности» MAS положительно коррелирует со шкалой «нейротизма» и отрицательно — со шкалой «экстраверсии»
EPI. Ст. з. концепции Айзенка, эти данные можно рассматривать как свидетельство низкой валидности шкалы MAS: «тревожность» коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой т. з.
MAS оказывается просто нечувствительным к особой разновидности «нейротизма» — нейротизму (тревожности) экстравертов: из перечня пунктов MAS исключены высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с теоретических
позиций К. Спенса и Ж. Тейлор, эта ситуация вполне закономерна, желательна и никак не является артефактом — следствием дефекта данного диагностического средства. Согласно К. Спенсу, пытавшемуся переносить на человеческое поведение теорию научения
Халла, MAS измеряет общий уровень драйва — неспециализированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфическая активация, по Айзенку) и интроверсии (неспецифическая активация) (Практикум по психодиагностике,
1984). Таким образом, названия тестов не всегда однозначно выражают понятие об измеряемом свойстве. В данном примере особенно подчеркивается роль психологической теории, лежащей в основе методики для раскрытия содержания показателей, получаемых
с ее помощью.
неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Иначе, В. к. определяет область теоретической структуры психологических явлений, измеряемых тестом.
Поскольку проявления конструктов в деятельности человека многообразны и неоднозначны с т. з. их выделения, процедура установления В. к. по сравнению с валидностью критериальной или валидностью содержательной сложна.
При объяснении связи полученных тестовых результатов с теоретическим конструктом необходимо постепенное накопление разнообразной информации о динамике развития измеряемого свойства, а также его взаимодействии с другими психологическими явлениями.
Среди конкретных методов характеристики В. к. в первую очередь необходимо назвать сопоставление исследуемого на предмет В. к. теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по
конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, психологическое качество, что и эталонная методика. Такая процедура валидизации напоминает определение критериальной валидности
в том смысле, что эталонный тест, валидность которого определена, выступает в качестве независимого критерия.
Следует однако заметить, что в отличие от критериальной валидизации при анализе В. к. не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию и результатам, и разрабатываемая
методика не обладает преимуществами краткости или легкости применения, это означает лишь дублирование теста, оправданное только с т. з. создания параллельной формы теста. Смысл процедуры В. к. состоит в установлении одновременно как сходства,
так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.
При анализе В. к. методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широким кругом других тестов, направленных на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми.
При этом В. к. характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где исходя из гипотезы, значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная (проверка степени
близости прямой или обратной связи) и дискриминантная (установление отсутствия связи) валидизации. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений В. к. В зарубежной психодиагностике такое операциональное
определение В. к. носит название «предполагаемой валидности» (assumed validity).
Прямое отношение к характеристике В. к. имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы
сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид В.
к.— факторную валидность.
Важным аспектом В. к. является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же
конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста. Следует отметить, что критерий внутренней согласованности указывает лишь на меру связи всего содержания
теста с измеряемым конструктом, не давая информации о природе измеряемого свойства.
При определении В. к. важное место принадлежит изучению динамики измеряемого конструкта. Идентификация конструкта может опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов
является применение критерия возрастной дифференциации (см. ВАЛИДНОСТЬ ПО ВОЗРАСТНОЙ ДИФФЕРЕНЦИАЦИИ), предусматривающей согласование изменений результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство
в возрастной динамике при переходе на новые этапы развития. Этот метод В. к. особенно важен для валидизации тестов интеллекта, достижений в обучении.
В комплекс сведений о В. к. методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, являются важной информацией для раскрытия области поведения, качества, представленных
в тесте в виде конструкта. Для характеристики В. к. необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако В. к. является качественно более высоким и комплексным уровнем описания теста, характеризуя
область измеряемого поведения в широких психологических понятиях. Благодаря данным В. к. мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических
категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.
В качестве примера, иллюстрирующего необходимость глубокого анализа теоретического конструкта, лежащего в основе конкретной методики, правильного применения теста и интерпретации его результатов, можно привести сопоставление двух популярных опросников
личностных «Проявления тревожности» шкалы (MAS) и варианта Айзенка личностных опросников EPI. Корреляционные исследования показывают, что шкала «тревожности» MAS положительно коррелирует со шкалой «нейротизма» и отрицательно — со шкалой «экстраверсии»
EPI. Ст. з. концепции Айзенка, эти данные можно рассматривать как свидетельство низкой валидности шкалы MAS: «тревожность» коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой т. з.
MAS оказывается просто нечувствительным к особой разновидности «нейротизма» — нейротизму (тревожности) экстравертов: из перечня пунктов MAS исключены высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с теоретических
позиций К. Спенса и Ж. Тейлор, эта ситуация вполне закономерна, желательна и никак не является артефактом — следствием дефекта данного диагностического средства. Согласно К. Спенсу, пытавшемуся переносить на человеческое поведение теорию научения
Халла, MAS измеряет общий уровень драйва — неспециализированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфическая активация, по Айзенку) и интроверсии (неспецифическая активация) (Практикум по психодиагностике,
1984). Таким образом, названия тестов не всегда однозначно выражают понятие об измеряемом свойстве. В данном примере особенно подчеркивается роль психологической теории, лежащей в основе методики для раскрытия содержания показателей, получаемых
с ее помощью.
Источник: Словарь-справочник по психологической диагностике 1989 г.