Определение, характеристики и примеры условного кондиционирования
оперантное кондиционирование илиинструментальная обусловленность - это тип обучения, когда поведение контролируется с последствиями.
Он основан на идее, что усиливающее поведение проявляется чаще, в то время как наказуемое поведение исчезает.
В чем разница между оперантным и классическим кондиционированием? В оперантной обусловленности за добровольным ответом следует подкрепление. Таким образом, добровольный ответ (например, подготовка к экзамену) с большей вероятностью произойдет в будущем. Напротив, в классической обусловленности стимул автоматически активирует непроизвольный ответ.
Оперантная обусловленность может быть описана как процесс, который пытается изменить поведение с помощью положительного и отрицательного подкрепления. Через оперантную обусловленность индивид устанавливает связь между определенным поведением и следствием. Примеры:
- Родители награждают хороших оценок за ребенка конфетой или другим призом..
- Учитель награждает тех учеников, которые спокойны и образованны. Студенты понимают, что, ведя себя так, они получают больше очков.
- Пища дается животному каждый раз, когда нажимается рычаг.
B.F. Скиннер (1938) ввел термин оперантное обусловливание. Скиннер выделил три типа ответов или операндов, которые могут следовать за поведением:
- Нейтральные операторы: ответы из окружающей среды, которые не увеличивают или уменьшают вероятность повторения поведения.
- усиливающие: ответы из окружающей среды, которые увеличивают вероятность повторения поведения. Усилители могут быть положительными или отрицательными.
- наказания: ответы из среды, которые уменьшают вероятность повторения поведения. Наказание ослабляет поведение.
Происхождение оперантной обусловленности
Торндайк был первым, кто осознал, что эта обусловленность включает в себя нечто большее, чем просто ответ и подкрепление. Ответ дается при наличии определенных раздражителей, учитывая три события: раздражитель, ответ и следствие ответа или подкрепление.
Эта структура облегчает развитие различных связей, таких как связь между стимулом и реакцией, что было для Торндайка ключом к формулировке закона эффекта. При этом он подтвердил, что ответы, сопровождаемые усиливающими последствиями, будут иметь большую вероятность возникновения, когда стимул появится снова.
Напротив, те ответы, которые сопровождаются отрицательными последствиями, будут иметь более низкую вероятность возникновения, когда стимул появляется снова. Закон действия является предшественником оперативной обусловленности или инструментальной обусловленности, как его назвал Торндайк.
Но для Скиннера, поведенческого психолога, условием было усиление поведения в соответствии с последствиями, которые ранее были бы получены.
В этой строке есть две формы кондиционирования:
- Классический или Павловский: он основан на ассоциации безусловных и условных стимулов, являющихся реакциями, контролируемыми предшествующими стимулами.
- Оперантная обусловленность: последующие или подкрепляющие стимулы вызывают определенное поведение. Скиннер объясняет, что если за поведением последует позитивное подкрепление, это увеличит вероятность такого поведения в будущем. Напротив, если за ответом не следует подкрепитель или если этот подкрепитель отрицателен, вероятность возникновения такого поведения в будущем будет ниже..
Основные понятия оперантной обусловленности
поддержка
Он отвечает за выдачу ответов, то есть вероятность того, что они произойдут, будь то больше или меньше в будущем. Это стимулирующий и последовательный стимул, поскольку он возникает после того, как ответ.
Невозможно знать, влияет ли данный подкрепитель на поведение, пока он не будет представлен случайно с ответом, и не будет подтверждено, что поведение изменяется вследствие подкрепления.
Существует два типа подкрепления: положительное и отрицательное. Оба имеют одинаковую цель увеличения вероятности того, что ответ будет выпущен в будущих ситуациях. Кроме того, для Скиннера подкрепления определяются посредством поведения, которое можно наблюдать и измерить.
Положительное подкрепление
Позитивное подкрепление усиливает поведение, предоставляя следствие, которое человек находит полезным.
Отрицательное подкрепление
Удаление неприятного усилителя также может усилить поведение. Это известно как отрицательное подкрепление, потому что устранение неблагоприятного раздражителя является «полезным» для животного или человека. Отрицательное подкрепление усиливает поведение, потому что оно останавливает или устраняет неприятный опыт.
Первичные усилители
Это были бы все те основные подкрепления, которые не нуждаются ни в какой истории предшествующей обусловленности, чтобы функционировать как таковые. Некоторые примеры будут вода, еда и секс.
Вторичные усилители
Вторичные усилители, если они будут основаны на предыдущих историях обусловленности благодаря ассоциации с безусловными стимулами. Некоторые примеры были бы деньги и квалификации.
Условие трех сроков
Это базовая модель оперантной обусловленности и состоит из трех компонентов: дискриминационного стимула, реакции и стимулирующего стимула..
Стимулирующим стимулом будет тот, который будет указывать субъекту на наличие усилителя, указывая, что, если он будет вести себя определенным образом, он сможет получить указанный усилитель. Напротив, у нас есть дельта-стимул или стимулы, которые указывают, что поведение не приведет к получению какого-либо типа усилителя.
Ответом будет поведение, которое будет выполнять субъект, чье выполнение приведет или не приведет к усилению стимула.
Стимулирующий стимул, как упоминалось выше, отвечает за распространение поведения, поскольку благодаря его появлению вероятность выдачи ответа будет увеличиваться или уменьшаться в будущем..
Понятия, которые нужно знать об оперантной обусловленности
наказание
Наказание также измеряется его влиянием на поведение субъекта. С другой стороны, в отличие от подкрепления, подразумевается уменьшение или подавление определенного поведения.
Наказание снижает вероятность поведения в более поздних ситуациях. Тем не менее, это не устраняет ответ, потому что если угроза наказания уменьшается, поведение может появиться снова.
В наказании также есть два различных типа или процедуры, положительное наказание и отрицательное наказание.
Положительное наказание
Это включает в себя представление отвратительного стимула после выполнения определенного поведения. Это дается в зависимости от ответа субъекта.
Отрицательное наказание
Он заключается в устранении стимула как следствия определенного поведения, то есть состоит в снятии положительного стимула после выполнения определенного поведения.
вымирание
При исчезновении ответ останавливается, потому что усилитель больше не появляется. Этот процесс основан на неспособности обеспечить соответствующий усилитель, который, как ожидается, будет достигнут и который привел к тому, что такое поведение будет поддерживаться с течением времени..
Когда ответ гаснет, дискриминационный стимул становится стимулом исчезновения. Этот процесс не следует путать с забыванием, которое дается, когда сила поведения уменьшается, если оно не было выпущено в течение определенного периода времени..
обобщение
В ответ на конкретную ситуацию или стимул, ответ обусловлен, который может появиться перед другими стимулами или аналогичными ситуациями..
дискриминация
Этот процесс противоположен процессу обобщения, он реагирует по-разному в зависимости от стимула и контекста.
Программы армирования
Скиннер также создал несколько программ подкрепления, включая программы непрерывного подкрепления и программы прерывистого подкрепления..
Программы непрерывного усиления
Они основаны на постоянном усилении ответа каждый раз, когда он представлен, то есть каждый раз, когда субъект выполняет желаемое поведение, он или она получает усиливающий или положительный стимул..
Программы прерывистого усиления
Напротив, здесь субъект не всегда получает подкрепление при выполнении желаемого поведения. Они определяются на основе количества полученных ответов или интервала времени между ответами, что приводит к различным процедурам.
Программы с фиксированным соотношением
В этих программах подкрепление предоставляется, когда субъект генерирует фиксированные и постоянные ответы. Например, в программе с отношением 10 человек получает подкрепление после того, как сделал десять ответов, когда стимул представлен.
Программы переменного разума
Он построен так же, как и предыдущий, но в этом случае количество ответов, которые субъект должен дать, чтобы получить подкрепление, является переменным.
Усилитель будет по-прежнему зависеть от количества ответов, выдаваемых субъектом, но с переменной причиной, благодаря которой субъект не может предсказать, когда будет получен усилитель.
Программы с фиксированным интервалом
В интервальных программах получение усилителя не зависит от количества ответов, которые дает субъект, но определяется прошедшим временем. Следовательно, первый ответ, полученный после прохождения определенного периода времени, усиливается.
В программах с фиксированным интервалом время между усилителем и усилителем всегда одинаково.
Программы с переменным интервалом
В этих программах усилитель получается через некоторое время, хотя время для каждого полученного усилителя разное.
Поведенческие изменения
Последовательные приближения или формирование
Формирование состоит из изменения поведения посредством формирования поведения или дифференциального усиления последовательных приближений..
Последовательность шагов, чтобы сформировать конкретное поведение. Прежде всего, мы определяем начальное поведение, которое должно сформировать, чтобы знать, к какому из них вы хотите обратиться.
Затем возможные усилители, которые должны использоваться, разграничиваются, и процесс разделяется на этапы или этапы для достижения окончательного поведения, усиливая каждый этап или последовательный подход до достижения последнего..
С помощью этой динамической процедуры и поведение, и его последствия трансформируются. В этом смысле последовательные подходы к объективному поведению усиливаются.
Однако для того, чтобы это было выполнено, необходимо начать с предыдущего поведения, которое субъект уже выполняет, чтобы постепенно усилить свое поведение, пока он не достигнет цели..
конкатенация
С его помощью новое поведение формируется из разложения на более простые шаги или последовательности, усиливая каждый ответ, данный на каждом из шагов, чтобы привести к созданию более сложного ответа в поведенческом репертуаре субъекта..
Длинные цепочки ответов могут быть сформированы с использованием условных усилителей, принимая функциональную единицу, создание которой приводит к приобретению и определению определенного навыка..
ссылки
- Оперантное кондиционирование. Получено с wikipedia.org
- Оперантное кондиционирование. Получено с e-torredebabel.com.
- Восстановленный из biblio3.url.
- Закон эффекта. Получено с wikipedia.org.
- Вымирание. Получено с wikipedio.org.
- Домян М. Принципы обучения и поведения. Paraninfo. 5-е издание.