O que é reforço no condicionamento operante?

Índice:

Anonim

Uma das muitas maneiras diferentes pelas quais as pessoas podem aprender é por meio de um processo conhecido como condicionamento operante (também conhecido como condicionamento instrumental), que envolve o aprendizado por meio de reforço ou punição. O tipo de reforço usado pode desempenhar um papel importante na rapidez com que um comportamento é aprendido e na força geral da resposta resultante.

Entendendo o Reforço

Reforço é um termo usado no condicionamento operante para se referir a qualquer coisa que aumente a probabilidade de ocorrer uma resposta. O psicólogo B.F. Skinner é considerado o pai dessa teoria. Observe que o reforço é definido pelo efeito que tem no comportamento - aumenta ou fortalece a resposta.

Por exemplo, o reforço pode envolver a apresentação de elogios (o reforçador) imediatamente depois que a criança guarda os brinquedos (a resposta). Ao reforçar o comportamento desejado com elogios, a criança terá maior probabilidade de realizar as mesmas ações novamente no futuro.

O reforço pode incluir qualquer coisa que fortaleça ou aumente um comportamento, incluindo recompensas, eventos e situações tangíveis específicas. Em uma sala de aula, por exemplo, os tipos de reforço podem incluir elogios, sair de um trabalho indesejado, recompensas simbólicas, doces, brincadeiras extras e atividades divertidas.

Reforço Primário e Secundário

Aqui estão algumas informações básicas sobre os dois principais tipos de reforço.

Reforço Primário

O reforço primário é algumas vezes referido como reforço incondicional. Ocorre naturalmente e não requer aprendizado para funcionar. Os reforçadores primários freqüentemente têm uma base evolutiva, pois auxiliam na sobrevivência da espécie.

Exemplos de reforçadores primários incluem:

  • Ar
  • Comida
  • Dormir
  • Sexo
  • Água

A genética e a experiência também podem desempenhar um papel importante em como funciona o reforço dessas coisas. Por exemplo, enquanto uma pessoa pode achar um certo tipo de comida muito gratificante, outra pessoa pode não gostar dessa comida de jeito nenhum.

Reforço Secundário

O reforço secundário, também conhecido como reforço condicionado, envolve estímulos que se tornaram recompensadores por serem emparelhados com outro estímulo de reforço. Por exemplo, ao treinar um cachorro, elogios e guloseimas podem ser usados ​​como reforçadores primários. O som de um clicker pode ser associado a elogios e mimos até que o próprio som do clicker comece a funcionar como um reforço secundário.

Tipos de Reforço

No condicionamento operante, existem dois tipos diferentes de reforço. Ambas as formas de reforço influenciam o comportamento, mas o fazem de maneiras diferentes. Os dois tipos incluem:

  • Reforço positivo: Isso envolve adicionar algo para aumentar a resposta, como dar um doce a uma criança depois que ela limpar o quarto.
  • Reforço negativo: Descreve a remoção de algo para aumentar a resposta, como cancelar um questionário se os alunos entregarem todos os deveres da semana. Ao remover o estímulo aversivo (o quiz), o professor espera aumentar o comportamento desejado (completar todos os deveres de casa).

Embora esses termos envolvam as palavras positivo e negativo, é importante notar que Skinner não os utilizou para significar "bom" ou "mau". Em vez disso, pense no que esses termos significariam quando usados ​​matematicamente.

Positivo é o equivalente a um sinal de mais, significando que algo é adicionado ou aplicado à situação. Negativo é o equivalente a um sinal de menos, o que significa que algo é removido ou subtraído da situação.

Exemplos do mundo real

Aqui estão alguns exemplos do mundo real de como o reforço pode ser utilizado para mudar o comportamento.

Reforço positivo

Durante o treino para o time de softball do escritório, o treinador grita: "Ótimo trabalho!" depois de lançar um arremesso. Por causa disso, é mais provável que você lance a bola da mesma maneira novamente. Este é um exemplo de reforço positivo.

Outro exemplo é que, no trabalho, você excede a cota de vendas de seu gerente no mês e, portanto, recebe um bônus como parte do seu salário. Isso torna mais provável que você tente exceder a cota mínima de vendas novamente no mês que vem.

Reforço Negativo

Você vai ao médico para tomar sua vacina anual contra a gripe, a fim de evitar pegar a gripe. Nesse caso, você está se engajando em um comportamento (recebendo uma injeção) para evitar um estímulo aversivo (ficar doente). Este é um exemplo de reforço negativo.

Outro exemplo é se você espalhar um pouco de gel de aloe vera em uma queimadura de sol para evitar que a queimadura doa. Aplicar o gel na queimadura evita um desfecho aversivo (dor), então esse é um exemplo de reforço negativo. Como o envolvimento no comportamento minimiza um resultado adverso, é mais provável que você use o gel de aloe vera novamente no futuro.

O reforço negativo também pode ser visto se você tomou paracetamol para se livrar de uma terrível dor de cabeça. Após cerca de 15 ou 20 minutos, a dor na cabeça finalmente desaparece. Como tomar os comprimidos permite que você elimine uma situação aversiva, é mais provável que você os tome novamente no futuro para lidar com a dor física.

Força da Resposta

Como e quando o reforço é aplicado pode afetar a força geral da resposta. Esta força é medida pelas seguintes qualidades da resposta após o reforço ser interrompido:

  • Precisão
  • Duração
  • Frequência
  • Persistência

Reforço Contínuo

Em situações em que o reforço atual é controlado, como durante o treinamento, o momento em que um reforço é apresentado pode ser manipulado. Durante os primeiros estágios de aprendizagem, o reforço contínuo é freqüentemente usado, como quando você ensina um novo truque a seu cão. Essa programação envolve o reforço de uma resposta toda vez que ela ocorrer.

Reforço Parcial

Depois que um comportamento é adquirido, geralmente é uma boa ideia mudar para um esquema de reforço parcial. Os quatro tipos principais de reforço parcial incluem:

  • Programações de intervalo fixo: Reforçando um comportamento após um determinado período de tempo.
  • Cronogramas de proporção fixa: Reforçando um comportamento após a ocorrência de um número específico de respostas.
  • Programações de intervalo variável: Reforçando o comportamento depois de decorrido um período de tempo imprevisível.
  • Cronogramas de razão variável: Reforçando o comportamento após um número imprevisível de respostas.

Uma palavra de Verywell

O reforço desempenha um papel vital no processo de condicionamento operante. Quando usado apropriadamente, o reforço pode ser uma ferramenta de aprendizagem eficaz para encorajar comportamentos desejáveis ​​e desencorajar os indesejáveis.

É importante lembrar que o que constitui reforço pode variar de uma pessoa para outra. Em um ambiente de sala de aula, por exemplo, uma criança pode achar uma guloseima reforçadora, enquanto outra pode ser indiferente a tal recompensa. Em alguns casos, o que é reforçador pode na verdade ser uma surpresa.

Se uma criança só recebe atenção dos pais quando está sendo repreendida, essa atenção pode realmente reforçar o mau comportamento. Aprendendo mais sobre como o reforço funciona, você pode obter uma melhor compreensão de como os diferentes tipos de reforço contribuem para a aprendizagem e o comportamento.