Режимы подкрепления

Найдено 5 определений
Показать: [все] [проще] [сложнее]

Автор: [зарубежный] Время: [современное]

РЕЖИМ ПОДКРЕПЛЕНИЯ
См. подкрепления, режим.

Источник: Оксфордский толковый словарь по психологии. 2002

Режим подкрепления
Schedule of reinforcement). Правило, устанавливающее вероятность, с которой будет происходить подкрепление.

Источник: Хьел Л., Зиглер Д. Теории личности. 2003

Режимы подкрепления (I)
reinforcement schedules) Согласно теории оперантного обусловливания, поведение регулируется его последствиями, т. е. подкрепляющими или наказывающими событиями, следующими за этим поведением. Связь между поведением и его последствиями называют контингенциальной (зависящей от случайного стечения обстоятельств). Подкрепление обычно осуществляется в прерывистом режиме. Скиннер указывал на то, что подкрепление может даваться разными способами и продемонстрировал, что даже небольшие различия в Р. п. могут приводить к существенным различиям в итоговом поведении. Наиболее детально изучены 4 осн. Р. п. Два из них - долевые (пропорциональные) режимы, при к-рых подача подкрепления ставится в зависимость от количества реакций, продуцируемых организмом. При режиме с фиксированной пропорцией (ФП) подкрепляется каждая n-ая реакция. При режиме с изменяющейся пропорцией (ИП) реакции подкрепляются на основе заранее определенной усредненной пропорции, однако конкретное число реакций, требуемых для получения подкрепления, непредсказуемо меняется от одного подкрепления к др. Два др. режима называются интервальными и определяются продолжительностью времени, к-рое должно пройти между подкреплениями. При этом подкрепляется первая реакция, возникающая по истечении установленного промежутка времени. При режиме с фиксированным интервалом (ФИ) этот интервал остается постоянным от одного подкрепления к др.; при режиме с изменяющимся интервалом (ИИ) интервалы между подкреплениями варьируют случайно вокруг нек-рого усредненного интервала. Помимо этих 4 осн. режимов, существует множество др., таких как дифференцированное подкрепление низких частот реакции (ДНЧ), дифференцированное подкрепление др. поведения (ДПД) и разнообразные комплексные и параллельные режимы, являющиеся комбинациями 4 осн. режимов. Каждый режим оказывает специфическое воздействие на поведение. Пропорциональные режимы обычно приводят к высокой частоте возникновения реакции, тогда как интервальные режимы вызывают более низкую частоту возникновения реакции. Изменяющиеся режимы, особенно режимы с изменяющимся интервалом, формируют чрезвычайно устойчивый паттерн поведения. Для реакций, вырабатываемых на основе изменяющихся режимов, тж характерна высокая сопротивляемость угасанию. Этот факт помогает понять, почему оказывается так трудно подавлять нежелательные формы поведения, поскольку большинство приобретаемых в естественных условиях форм поведения вырабатываются на основе изменяющихся режимов. См. также Оперантное обусловливание, Подкрепление Р. А. Шоу

Источник: Корсини Р., Ауэрбах А. Психологическая энциклопедия. 2006

Режимы подкрепления (II)
schedules of reinforcement) Нек-рые стимулы, напр., пища для голодного животного или одобрение для чел., ищущего расположения аудитории, увеличивают частоту реакций, к-рые вызывают появление этих стимулов (или предшествуют им). Крыса, получившая пищу вслед за нажатием на рычаг, в дальнейшем с большей вероятностью будет нажимать на этот рычаг, а чел., чьи слова вызвали горячее одобрение аудитории, с большей вероятностью будет продолжать свою речь. Стимулы, к-рые усиливают предшествовавшие им реакции, называются подкрепляющими стимулами, или просто подкреплениями. Для того, чтобы усилить желательную реакцию, ее не обязательно подкреплять всякий раз после того, как она возникла (напр., нажатие крысы на рычаг может вызывать появление пищи не всякий раз, а лишь после пяти таких нажатий). Полный набор тех условий, при к-рых осуществляется подкрепление реакции, называется Р. п.. Исслед. показывают, что Р. п. во многом определяет воздействие конкретного подкрепления на реакцию. Здесь будут рассмотрены два аспекта изучения Р. п.: поведенческие эффекты и теорет. трактовка. Поведенческие эффекты Принято выделять 3 поведенческих эффекта Р. п.: приобретение, поддержание и сохранение реагирования. В целом приобретение (или научение) замедляется в том случае, когда реакция подкрепляется лишь после того, как она возникла несколько раз. Крыса, научающаяся нажимать на рычаг, будет быстрее приобретать эту реакцию, если пища появляется после каждого нажатия, а не после неск. нажатий. Р. п., при к-ром пища предъявляется вслед за каждым возникновением реакции, называется непрерывным, или постоянным режимом; режим, при к-ром пища предъявляется лишь после неск. воспроизведений реакции, называется прерывистым, или парциальным режимом. После того как реакция уже приобретена, для поддержания реагирования обычно оказывается достаточно прерывистых Р. п., особенно если подкрепляющий режим постепенно изменяется от постоянного к прерывистому. Прерывистые режимы поддерживают реагирование и, что более важно, задают общую частоту и временные паттерны реагирования. Напр., одно и то же количество подкреплений может вызывать как высокую, так и низкую частоту реагирования, в зависимости от характеристик режима. Традиционно Р. п. классифицируют на основе 2 характеристик: количества реакций и времени реагирования, необходимого для подкрепления. Режимы, при к-рых для появления подкрепления требуется определенное количество реакций, называются пропорциональными (долевыми) режимами; в них задается пропорциональное отношение числа реакций на одно подкрепление. Напр., если крыса должна четыре раза нажать на рычаг, прежде чем пятое нажатие приведет к появлению пищи, пропорциональный режим будет определяться как 5:1. Режимы, в к-рых помимо самой реакции, необходимой для появления подкрепления, предъявляются требования ко времени реагирования, называются интервальными режимами. Напр., если должна пройти 1 минута с момента последнего появления пищи, прежде чем нажатие на рычаг вновь вызовет ее появление, такой интервальный режим будет определяться как минутный. В целом пропорциональные режимы вызывают более высокую частоту реагирования по сравнению с интервальными режимами. Как в пропорциональных, так и в интервальных режимах может задаваться либо фиксированное, либо изменяющееся количество реакций или времени соответственно. Так, если пища появляется после каждого пятого нажатия на рычаг, то этот режим будет режимом с фиксированной пропорцией; если пища появляется в среднем после пяти реакций (напр., после трех, пяти или семи реакций), то такой режим будет режимом с изменяющейся пропорцией. В целом режимы с изменяющимся подкреплением поддерживают стабильную частоту реагирования, в то время как фиксированные режимы вызывают изменяющуюся частоту реагирования. При фиксированных режимах частота реагирования вслед за появлением подкрепления сначала снижается, когда реакция уже не может вызвать этого подкрепления, а потом начинает увеличиваться. Третий поведенческий эффект Р. п. касается сохранения реагирования (т. е. пределов, в к-рых данная реакция продолжает возникать уже после того, как она больше не вызывает появления подкрепления). В целом, прерывистые Р. п. в значительной степени повышают сохранение реагирования (т. е. сопротивляемость угашению). Поскольку частотные и временные характеристики реагирования в высокой степени зависят от конкретного Р. п., мн. стороны поведения, традиционно рассматриваемые в мотивационных терминах, могут интерпретироваться как эффекты Р. п. Напр., родители, к-рые все-таки покупают ребенку сладости после долгого сопротивления его просьбам, сопровождаемым нытьем и хныканьем, ненамеренно подкрепляют такое поведение в соответствии с пропорциональным режимом. Поведенческий анализ относит это поведение к тому Р. п., на основе к-рого оно приобреталось и поддерживалось, в отличие от др. способов объяснения такого поведения, относящих его к существованию "потребности" в сладостях или к определенному внутреннему состоянию, напр., к избалованности этого ребенка. Теоретические трактовки режимов подкрепления Теорет. трактовка Р. п. приняла две комплементарные формы: молярные и молекулярные подходы. В молярных подходах осн. усилия концентрируются на объяснении глобальных аспектов поведения, вызываемого тем или иным режимом (напр., предельной частоты реакций или продолжительности реагирования в ходе угашения реакции). В качестве иллюстрации здесь можно привести общее заключение о том, что организм при столкновении с двумя одновременно доступными реакциями (так называемый параллельный Р. п.) будет распределять свои реакции пропорционально количеству подкреплений, вызываемых этими реакциями. Так, если в течение определенного периода времени одна реакция будет вызывать в три раза меньше подкреплений, чем др., то реакций первого типа будет возникать в три раза меньше. Это молярное соотношение между числом подкреплений и числом реакций выражается общим принципом соответствия: обучающийся согласует относительное число реакций с относительным числом подкреплений. С др. стороны, наблюдаемые в том или ином Р. п. особенности поведения могут анализироваться с т. зр. моментальных, или молекулярных отношений между конкретными стимулами, реакциями и подкреплениями, возникающими в каждый момент времени. При данном подходе изучаемые молярными подходами глобальные отношения рассматриваются в качестве кумулятивного выражения молекулярных процессов. То есть, молярные отношения являются лишь следствиями молекулярных процессов и не представляют собой фундаментальных принципов. Молекулярного подхода в интерпретации Р. п. придерживался Б. Ф. Скиннер. В противоположность этому, при молярном подходе глобальные отношения рассматриваются в качестве фундаментальных на основании того, что такие отношения обеспечивают описание поведения на том единственном уровне, на к-ром могут наблюдаться организованные функциональные отношения. Существующие исслед. указывают, что нек-рые молярные отношения действительно могут интерпретироваться как суммарное выражение молекулярных процессов, тогда как др. не могут. Молярно-молекулярная проблема остается предметом теорет. дискуссий в данной области. Независимо от того, какой из этих уровней в конечном итоге окажется наиболее полезным в трактовке эффектов Р. п., исслед. последних остается по-прежнему актуальной задачей вследствие их чрезвычайно важной роли в приобретении, поддержании и сохранении поведения как в условиях лабораторных экспериментов, так и в повседневной жизни. См. также Экспериментальные планы, Кривые научения, Теории научения, Оперантное обусловливание, Вознаграждения Дж. У. Донахью

Источник: Корсини Р., Ауэрбах А. Психологическая энциклопедия. 2006

ПОДКРЕПЛЕНИЯ, РЕЖИМЫ
Совершенно буквально – любой из режимов, в котором субъекту предъявляется подкрепление, определяемых некоторыми пространственными, временными или последовательными аспектами реакции. В приводящемся ниже описании подразумевается, что речь идет в оперантном поведении, хотя некоторые из этих режимов использовались в классическом обусловливании (например, непрерывное подкрепление), употребление термина режим подкрепления в таком контексте редко. Притягательность режимов подкрепления для многих психологов, особенно скиннеровских бихевиористов, объясняется тем фактом, что подкрепление поведения в повседневной жизни обычно нерегулярно и неоднообразно. Игроки не выигрывают после каждой ставки, не каждое посаженное зерно прорастает, и многие политические речи не приводят к убеждению избирателей. Однако игроки продолжают делать ставки, фермеры выращивать зерновые культуры, а политики (увы) говорить речи. Поэтому были приложены значительные усилия для исследования того эффекта, который оказывает режимы представления подкрепления на создание и поддержание поведения. Следующий список включает наиболее полно изученные режимы подкрепления. Используемая здесь система классификации более или менее Стандартна, хотя в специальной литературе можно встретить и другие: сначала представлены "простые" режимы, где имеется единственный тип сопряженности между реакцией и подкреплением; затем описываются "составные" режимы, где действуют два или более простых режима; в заключение приводятся "специальные" режимы, которые не подходят ни к одному из пре-адущих классов. Практически любому, кто прочтет это описание, будет ясно, что диапазон эзможностей почти безграничен. У читателя также может появиться чувство, то многие исследования – не более, чем упражнения в эзотерике. Даже последователей Скиннера иногда забрасывают такими намеками. Преодоление такой неуверенности обычно выражается в виде списка различных способов Применения в образовательных, индустриальных, организационных и терапевтических условиях (которых, нужно признать, довольно много). I. Простые режимы. Все нижеперечисленные режимы, в которых имеется только одна связь между реакцией и появлением подкрепляющего стимула. Непрерывное подкрепление (crf, или CRF). Довольно просто: подкрепляется каждая реакция. 2. Угасание (ехt, или EХТ). Ни одна реакция не подкрепляется. 3. Фиксированный коэффициент (FR). Класс режимов, при котором отношение между реакциями и подкреплениями фиксировано, то есть подкрепление следует за установленным числом реакции совершенна с момента предшествующего подкрепления. Таким образом, FR 10 означает, что подкрепляется каждая 10-я реакция. Обратите внимание, что, согласно этому способу употребления, CRF фактически представляет собой режим с фиксированным коэффициентом, а именно с FR =1. 4. Переменный коэффициент (VR). Класс режимов, при которых отношение между реакциями и подкреплениями варьируется некоторым случайным или полуслучайным образом, но с определенным средним значением. Таким образом, VR 10 означает, что в среднем подкрепляется каждая 10-я реакция. 5. Случайный коэффициент (ЯЯ). Вариация режима VR, при которой коэффициент определяет степень вероятности с которой будет подкрепляться любая данная реакция. При RR 10, например, вероятность того, что любая данная реакция будет подкреплена - 0.10, независимо от числа реакций, сделанных со времени предыдущего подкрепления. 6. Фиксированный интервал (FI). Режимы смежности по времени, при которых подкрепляется последняя реакции, сделанная через определенный интервал времени после предшествующего подкрепления. Обычно в протоколах используется следующая система обозначений: FI 3, что означает: фиксированный интервал = 3 минуты. 7. Переменный интервал (VI). Режимы смежности во времени, при которых последовательность поступления подкрепления "устанавливается" случайным или полуслучайным образом с определенным средним значением. Таким образом, VI 3 означает, что в среднем интервал между потенциальными подкреплениями составляет 3 минуты. Обратите внимание, что режимы VI имеют тенденцию вызывать реакции с очень регулярной скоростью, в то время как режимы FI имеют тенденцию вызывать внезапные реакции, сопровождаемые периодами слабых реакций или их отсутствия. 8. Фиксированное время (FT). Класс режимов подкрепления, при которых, как и при режимах FI, подкрепление поступает через фиксированные временные интервалы, но в отличие от режимов FI независимо от того, совершает субъект какие-либо реакции или нет. 9. Переменное время (VT). Подобно режимам FT, но варьируется время между подкреплениями. 10. Дифференциальное подкрепление низкой скорости (drl, или DRL). Класс режимов, основанных на определенной скорости реакции, которая не должна превышаться, чтобы возникло подкрепление. Таким образом, при DRL 10 (секунд) должно пройти 10 минут между реакциями, иначе никакого подкрепления не последует: реакция, совершенная слишком быстро, "возвращает часы в исходное положение" и нужно, чтобы прошли другие 10 секунд без реакции. Дифференциальное подкрепление высокой скорости (drh или DRH). В отличие от DRL, здесь скорость должна превысить некоторое заданное значение, чтобы возникло подкрепление. DRH 1 (секунда) означает что время между реакциями должно быть меньше 1 секунды. 11. Дифференциальное подкрепление заданного темпа реакций (drp, или DRP). 12. Дифференциальное подкрепление другого поведения (dro, или DRO). II. Составные режимы. Ниже приводятся режимы, в которых два или более простых режима объединены в составную форму. Они могут быть либо «последовательными», в этом случае один компонент режима должен быть выполнен до начала действия другого (других), либо они могут быть "одновременными", в этом случае два или более режима действуют фактически одновременно. 1. Тандем (tand). Последовательный режим, при котором подкрепление зависит от последовательного завершения двух или более простых ре-шов. Таким образом, в тандеме FI 2 FR 5 компонент FI 2 должен быть выползи до того, как начнется отсчет времени реакции для FR 5. Полная последовательность выполняется без различительных стимулов для субъекта в отношении того, какой компонент действует в любой момент времени. 2. Цепной (chain). Последовательный режим, подобный тандему, за исключением того, го различительный стимул связан с каждым компонентом. 3. Смешанный (mix). Последовательный режим, в котором представлены два или более простых режима по очереди или произвольно. Как и в режиме тандема, здесь не используются никакие различительные стимулы. 4. Множественный (mult). Такой же, как и смешанный режим, но с добавлением различительных стимулов для выделения каждого из компонентов. 5. Альтернативный (alt). Одновременный режим, в котором выполнение любого из компонентов вызывает подкрепление. После подкрепления этот режим "переустанавливается". Таким образом, при alt FI 5 FR 50 подкрепление возникает либо после 50-й реакции, если она возникла в течение 5 минут, либо после 1-й реакции, совершенной в конце 5-минутного периода, считая с завершения последнего подкрепления. 6. Конъюнктивный (conj). Подобен альтернативному, за исключением того, что здесь все компоненты должны быть выполнены прежде, чем будет предъявлено подкрепление. 7. Конкурентный (сопс). Общее обозначение, пользуемое в отношении всех ситуаций, в которых два или более режима, установленных независимо друг от друга, действуют одновременно. III. Специальные режимы. Эти режимы содержат временные или скоростные компоненты, которые не вполне вписываются в вышеупомянутые категории. 1. Взаимозависимый (interlock). Класс режимов, в которых подкрепление дается после завершения данного числа реакций, но это число изменяется как функция от времени, начиная с последнего подкрепления. Например, линейное сокращение числа реакций может быть запрограммировано так, что, чем дольше субъект ждет, тем меньшее число реакций требуется для подкрепления. 2. Регулируемый (adj). Класс режимов, в которых условия для возникновения подкрепления систематически регулируются как функция от действий субъекта. Например, FR может увеличиваться или уменьшаться в зависимости от того, является ли латентное время первой реакции после подкрепления эльшим или меньшим, чем некоторое предварительно определенное значение. 3. Сопряженный (conjug). Режим, в котором уровень интенсивности некоторого подкрепляющего стимула увеличивается или уменьшается в завимости от скорости реагирования; например, яркость экрана телевизора тематически изменяется в зависимости от скорости. 4. Интерполируемый iter). Режим, в котором маленький блок подкреплений из одного режима вводятся без различительных стимулов в другой действующий режим. Существуют и другие режимы. См. часы, счетчик, кумулятивный самописец, оперантное обусловливание, подкрепление, формирование, скиннеровский, тайм-аут и связанные с ними термины.

Источник: Оксфордский толковый словарь по психологии. 2002

Похожие термины: