ВАЛИДНОСТЬ
Источник: Р.Чалдини, Д.Кенрик, С.Нейберг. Социальная психология. 2002
Источник: Миллер С. Психология развития, методы исследования. 2002
Источник: Социальная психология. Пойми себя чтобы понять других. СПб. Прайм-Еврознак 2002
Источник: Хьел Л., Зиглер Д. Теории личности. 2003
Источник: Мацумото Д. Психология и культура
Источник: Гудвин Дж. Исследование в психологии методы и планирование. 2004
Источник: Морозов А.В. Деловая психология. 2000
Источник: Словарь по профориентации и психологической поддержке
Источник: Р. Комер. Общая психология. 2007
Источник: Акимова М.К. Психологическая диагностика
Источник: Словарь по психогенетике
Источник: Основные понятия психодиагностики и экспериментальной психологии. Cловарь 2006
Источник: Жмуров В.А. Большая энциклопедия по психиатрии. 2012
Источник: Анцупов А.Я., Шипилов А.И. Словарь конфликтолога. 2009
Источник: Психологичеcкий словарь. М. Владос. 2007
Проблема валидности возникает в ходе разработки и практического применения теста или методики, когда требуется установить соответствие между степенью выраженности интересующего свойства личности и методом его измерения. Валидность указывает, что именно тест или методика измеряет и насколько хорошо это делает; чем они валиднее, тем лучше отображается в них то качество (свойство), ради измерения коего они создавались. Количественно валидность может выражаться через корреляции результатов, полученных с помощью теста или методики, с другими показателями, - например, с успешностью выполнения соответственной деятельности. Валидность можно обосновать разными путями, чаще всего - комплексно. Применяются также дополнительные понятия валидности концептуальной, критериальной, конструктивной, и прочие виды валидности - со своими способами установления их уровня. Требование валидности весьма важно, и многие нарекания в адрес тестов или иных психодиагностических методик связаны с сомнительностью их валидности. Например, валидность измерения интеллекта зависит:
1) от определения понятия интеллекта, являющего ту или иную концепцию этого феномена;
2) от состава тестовых заданий, разрабатываемых согласно этой концепции;
3) от эмпирических критериев. Разные концепции требуют различного состава заданий, поэтому важен вопрос валидности концептуальной. Чем больше задания соответствуют данной авторской концепции интеллекта, тем увереннее можно говорить о валидности концептуальной теста. Корреляция теста с эмпирическим критерием указывает на его возможную валидность по отношению к данному критерию. Определение валидности теста всегда требует постановки дополнительных вопросов: валидность для чего? для какой цели? по какому критерию? Итак, понятие валидности относится не только к тесту, но и к критерию оценки его качества. Чем выше коэффициент корреляции теста с критерием, тем выше валидность. Развитие анализа факторного позволило создавать тесты, валидные по отношению к идентифицируемому фактору. Только проверенные на валидность тесты можно использовать в ориентации профессиональной, отборе профессиональном, в исследованиях научных.
Источник: Головин С.Ю. Словарь практического психолога. 1998
(от англ. valid – пригодный) – комплексная характеристика теста, включающая сведения об области исследуемых явлений и репрезентативности исследуемой по отношению к ней диагностической процедуры; один из основных критериев качества теста, понятие, указывающее нам, 1 – что тест измеряет и 2 – насколько хорошо он это делает.
· дифференциальная . (differential validiti) – один из компонентов прогностической валидности, отражающий способностью методики дифференцировать испытуемых по отдельным областям проявления исследуемых свойств.
· инкрементная . (incremental validiti) – один из компонентов прогностической валидности, отражающий практическую ценность методики при проведении отбора.
· конкурентная . (concurrent validiti) – характеристика теста, отражающая его способность различать испытуемых на основании диагностического признака, являющегося объектом исследования в данной методике; измеряется корреляцией результатов данного теста с измерениями при помощи других тестов, предназначенных для измерения той же самой переменной.
· конструктная . (construct validiti) – один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста; чем больше результаты теста соответствуют теоретической гипотезе о природе измеряемой переменной, тем выше конструктная валидность теста.
· очевидная . (face validiti) – представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. Чем более тест выглядит измеряющим то, для измерения чего он предназначен, тем выше его очевидная валидность.
· прогностическая . (predictive validiti) – информация о тесте, характеризующая степень точности и обоснованности суждения о диагностируемом психологическом качестве по его результату спустя определенное время после измерения; чем лучше тест может прогнозировать критерий, тем выше его прогностическая валидность.
· содержательная . (content validiti) – один из основных типов валидности, характеризующий степень репрезентативности содержания заданий теста по отношению к измеряемой области психических свойств.
Источник: Конюхов Н.И. Прикладные аспекты современной психологии: термины, концепции,методы. 1992
Источник: М. Кордуэлл. психология от А до Я: Словарь-справочник, 2000 г
Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует (представляет) безупречный, и чем лучше эта репрезентативность, тем выше В. эксперимента. Таким образом, повышение В., т. е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера, реальных условий и, во-вторых, от адекватности выбора средств. Так, источники нарушения В., (прежде всего, ненадежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля, позволяют приблизиться к нему, т. е. обеспечить высокую В. для обобщения экспериментальных результатов. В. полученных данных можно оценить статистически: например, В. теста (в корреляционном исследовании) определяется степенью корреляции результатов его .выполнения с изучаемым видом деятельности испытуемых.
В соответствии с различными типами безупречного эксперимента различают внутреннюю и внешнюю В.:
— внутренняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами идеального бесконечного экспериментов. Повышение внутренней В. связано с устранением результатов действия побочных переменных и с усреднением их изменчивости и нестабильности. Внутренняя В. — первое и необходимое требование к экспериментальным выводам: эксперимент, не обладающий внутренней В., названы автором просто неудачным,
— внешняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами эксперимента полного соответствия. Повышение внешней В. обеспечивается достижением соответствия уровней дополнительных переменных в эксперименте уровням этих переменных в изучаемой реальности. Эксперимент, не обладающий внешней В., является неверным, не соответствующим поставленной гипотезе (но, быть может, пригодным для проверки, другой гипотезы).
Следует отметить, что любую переменную (фактор), отличную от независимой, также оказывающую влияние на зависимую переменную, автор называет просто “ other ” - другая. При переводе для обозначения таких переменных используются два разных термина: “побочная” - применительно к переменной, нарушающей внутреннюю В., и “дополнительная” - переменная, уровень которой входит в экспериментальную гипотезу и должен быть адекватно представлен с целью достижения внешней В. Иногда одни и те же факторы могут выступать в эксперименте и как побочные (нарушающие внутреннюю В.), и как дополнительные (влияющие на внешнюю В.). Устранение и унификация побочных факторов, повышающая внутреннюю В., может приводить к несоответствию уровней дополнительных переменных, что снижает внешнюю В. (см. Соответствие).
-операциональная В.—разновидность внешней В. для лабораторного эксперимента; соответствие (или степень соответствия) применяемых методических процедур тем теоретическим понятиям, которые входят в экспериментальную гипотезу.
Источник: Готтсданкер Р. Основы психологического эксперимента
В наиболее простой и общей формулировке В. теста это «...понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» (А. Анастази, 1982). В стандартных требованиях к педагогическим и психологическим тестам (Stan-darts..., 1974)
В. определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы, а также о степени их обоснованности на основании конкретных тестовых оценок или других форм оценивания.
В психологической диагностике В.— обязательная и наиболее важная часть информации о методике, включающая (наряду с указанными выше) данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из
различных источников (теоретические ожидания, наблюдение, экспертные оценки, результаты других методик, достоверность которых установлена и т. д.), суждение об обоснованности прогноза развития исследуемого качества, связь изучаемой области
поведения или особенности личности с определенными психологическими конструктами. В. описывает также конкретную направленность методики (контингент испытуемых по возрасту, уровню образования, социально-культурной принадлежности и т. д.) и
степень обоснованности выводов в конкретных условиях использования теста. В совокупности сведений, характеризующих В. теста, содержится информация об адекватности применяемой модели деятельности с т. з. отражения в ней изучаемой психологической
особенности, о степени однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом.
Важнейшая составляющая В.— определение области изучаемых свойств — имеет ведущее теоретическое и практическое значение при выборе методики исследования и интерпретации ее данных. Содержащаяся в названии теста информация, как правило, недостаточна
для суждения о сфере его применения. Это лишь обозначение, «имя» конкретной процедуры исследования. В качестве примера можно привести широко известную в различных областях психологии корректурную пробу. Область изучаемых свойств личности включает
устойчивость и концентрацию внимания, психомоторную подвижность. Данная методика в достаточной степени позволяет получать оценки выраженности этих психологических качеств у испытуемого, хорошо согласуется с другими показателями, полученными
различными методами и, следовательно, обладает высокой В. Наряду с этим результаты выполнения корректурной пробы подвержены влиянию большого количества других факторов (нейродинамические особенности, характеристики кратковременной и оперативной
памяти, индивидуальная переносимость монотонии, развитие навыка чтения, особенности зрения и т. д.), по отношению к которым методика не является специфичной. В случае применения корректурной пробы для их измерения В. будет невелика или сомнительна.
Таким образом, очерчивая сферу применения методики, В. отражает и уровень обоснованности результатов измерения. Очевидно, что при небольшом количестве сопутствующих факторов, влияющих на результат исследования, а значит, при их незначительном
воздействии на результат теста достоверность тестовых оценок будет выше. Еще в большей степени достоверность данных теста определяется набором измеряемых свойств, их значимостью для осуществления диагностируемой сложной деятельности, полнотой
и существенностью отражения в материале теста предмета измерения. Так, для удовлетворения требованиям В. диагностическая методика, предназначенная для профотбора, должна включать анализ широкого круга нередко различных по своей природе показателей,
наиболее важных для достижения успеха в данной профессии (уровень внимания, особенности памяти, психомоторика, эмоциональная устойчивость, интересы, склонности и т. д.).
Как видно из вышеизложенного, в понятие В. входит большое количество самой разнообразной информации о тесте. Различные категории этих сведений и способы их получения образуют типы В.
Диагностическая (конкурентная) В. отражает способность теста дифференцировать испытуемых по изучаемому признаку. Анализ диагностической В. имеет отношение к установлению соответствия показателей теста реальному состоянию психологических особенностей
испытуемого в момент обследования (см. ВАЛИДНОСТЬ ТЕКУЩАЯ). Примером определения этого типа В. может быть исследование по методу контрастных групп. Проведение теста интеллекта у нормально развивающихся детей и их сверстников с нарушениями
в интеллектуальном развитии может выявить глубокие количественные и качественные различия в выполнении заданий сравниваемыми группами. Степень надежности дифференциации детей первой и второй групп по данным теста будет характеристикой диагностической
В. оценки умственного развития, получаемой с помощью данной методики.
Сведения, характеризующие степень обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют валидность прогностическую методики. Заключение об этом типе В. может быть получено, напр., путем
сравнения тестовых оценок в одной и той же группе испытуемых спустя определенное время. Основой прогностической В. является определение того, насколько важен исследуемый признак с т. з. деятельности испытуемого в будущем с учетом закономерно
изменяющихся обстоятельств, перехода на другой уровень развития.
Большинство методик, особенно тестов способностей и интеллекта, исследуются на предмет диагностической и прогностической В. Два этих типа В. нередко объединяются в понятии валидности эмпирической. Здесь подчеркивается общность подхода к их определению,
который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве ва-лидизации критерия (см. ВАЛИДНОСТЬ КРИТЕРИАЛЬНАЯ). Критерий В, выступает в качестве меры, показателя
исследуемых психологических особенностей. Так, тесты специальных способностей проверяются путем сопоставления с результатами обучения по другим предметам, достижениями в музыке, рисовании и т. д. Тесты общих интеллектуальных способностей валидизируются
сравнением с еще более широкими характеристиками школьных достижений (общей успеваемостью, овладением сложными системами знаний и навыков). Критерий В. является независимым от теста показателем, обладающим непосредственной ценностью для определенных
областей практики. Напр., в области педагогической психологии — это «успеваемость», психологии труда —«производительность», медицинской психологии — «состояние здоровья» и т. д. В качестве непосредственных критериев часто используются экспертные
оценки и характеристики, данные педагогами, сотрудниками, руководителями лицам, обследованным с помощью валидизируемого теста.
Во многих случаях бывает сложно или невозможно подобрать адекватный критерий валидизации. При этом особую важность приобретает комплекс характеристик, входящих в тип теоретической В. При разработке и использовании теста может быть сформулирован
ряд гипотез о том, как будет коррелировать исследуемый тест с другим тестом, измеряющим родственные или противоположные психологические характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических представлений об измеряемых
свойствах как о психологическом конструкте. Подтверждение гипотез свидетельствует о теоретической обоснованности методики, т. е. о степени ее конструктной валидности. Этот тип В. является наиболее сложным и комплексным. Для подтверждения соответствия
получаемых с помощью теста результатов теоретическим ожиданиям и закономерностям используется саман различная информация, в том числе и относящаяся к другим типам В.
Валидность содержательная (внутренняя, логическая) — комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям. Одним из основных требований при валидизации методики в этом направлении является отражение
в содержании теста ключевых сторон изучаемого психологического феномена. Если область поведения или способность очень сложна, то содержательная В. требует представления в заданиях теста всех важнейших составных элементов исследуемого явления.
Так, при разработке теста «вербального интеллекта» необходимо ввести группы заданий (субтестов) для проверки довольно разнородных по своему операциональному составу навыков письма и чтения.
Наряду с перечисленными основными типами В. (содержательной, критериальной н конструктной) на практике выделяют факторную, перекрестную (конвергентную) и дискриминантную В. (см. ВАЛИДНОСТЬ КОНСТРУКТНАЯ).
Классификация типов В. в достаточной мере условна, так как нередко для различных критериев В. применяются общие методы определения, а с другой стороны, одни и те же исходные данные могут интерпретироваться с т. з. различных типов В.
В психологической диагностике не существует универсального подхода к характеристике В. Для валидизации каждого вида психодиагностических процедур и отдельных тестов могут применяться различные типы В. Сведения, входящие в комплекс В., можно оценить
качественно и количественно (при помощи коэффициента валидности), нередко их можно описать. Однако силу сложности, комплексности, ситуативности го отношению к конкретным условиям применения методики В. в целом невозможно измерить, о ней можно
лишь судить.
Реальная В. раскрывается только в результате накопления значительного опыта работы с тестами. Получение новых, расширенных сведений о В. может радикально изменить представление о сфере приложения и эффективности методики. Так, некоторые методики,
разработанные для диагностики вербальных сторон интеллекта, с достаточной В. отражают лишь уровень осведомленности. Сфера применения теста в ходе его длительной валидизации может быть, напротив, расширена. В качестве примера можно привести
Равена прогрессивные матрицы, которые были разработаны для изучения определенных сторон перцептивной деятельности, однако оказались в значительной степени насыщены фактором, общим для тестов интеллекта (см. ФАКТОР «G»).
Реальная В. ряда психодиагностических методик, особенно тестов интеллекта, достижений в обучении, профессиональной пригодности, опросников личностных изменяется со временем. Это объясняется устареванием возрастных статистических норм, изменением
социальных норм и образцов поведения, методов обучения и содержания заданий, требований к профессиям. Это обстоятельство требует периодического контроля В. методик.
Источник: Словарь-справочник по психологической диагностике 1989 г.