인간행동의 심리학적 이해

심리학과, 임상심리사 2급, 정신보건 상담사 등 인간행동의 심리학적 이해 요점 요약 12. 조작적 조건화와 관찰학습

롤라❤️ 2023. 2. 20. 08:07
반응형

12. 조작적 조건화와 관찰학습

1 스키너의 조작적 조건화 실험
1) 배경
(1) 고전적 조건화의 한계
☞ 새로운 반응 학습을 설명할 수 없음
☞ 능동적인 학습을 설명할 수 없음

(2) 효과의 법칙(law of effect)
☞ 정의: 좋은 결과가 있는(보상받은) 행동은 재발할 가능성이 크다는 원리
☞ 쏜다이크(Thorndike)는 고양이 문제상자 탈출 실험을 통해 원리를 정립

Thorndike의 고양이 문제상자


2) 조작적 조건화 원리
(1) 조작적 조건화와 스키너 박스

☞ 조작적 조건화(Operant Conditioning): 어떤 반응에 대해 선택적으로 보상함으로써 그
반응이 일어날 확률을 증가시키는 학습 방법
☞ 스키너 박스: 스키너(Skinner)는 자신의 이름을 딴 스키너 상자를 개발하여, 조건형성
과정을 실험관찰하고 자료를 수집하여 조작적 조건화 학습이론을 정립
- ‘레버누르기(목적 행동) + 먹이(보상)’의 연합을 통해 새로운 행동을 학습시킴
- 응용: 동물묘기공연, 칭찬스티커, 커피쿠폰, 포상금 등
- “칭찬은 고래도 춤추게 한다.”

(2) 조작적 조건화 과정
① 강화(reinforcement): 목표행동의 빈도와 강도를 증가시키는 과정
☞ 강화물(reinforcer): 특정 행동 뒤이어 특정 자극이 제시되는 시행이 반복됨에 따라 그
행동이 재현될 가능성을 증가시키는 자극
☞ 강화의 종류
- 정적 강화: 긍정적인 자극을 제공하여 행동을 증가시키는 것
예: 추가 점수, 칭찬 등
- 부적 강화: 부정적 자극을 중지시키거나 감소시킴으로써 행동을 증가시키는 것
예: 더운 날 시원한 아이스크림, 두통약, 휴강 등
② 처벌(punishment): 목표행동의 빈도와 강도를 감소시키는 과정
☞ 처벌인: 특정 행동 뒤이어 특정 자극이 제시되는 것이 반복되어 목표행동의 재현 가능성을
감소시키는 자극
☞ 처벌의 종류
- 정적 처벌: 바람직하지 않는 자극을 제공하여 행동을 감소시키는 것
예: 회초리, 잔소리 등
- 부적 처벌: 바람직한 것을 제거함으로서 행동을 감소시키는 것
예: 벌금, 타임아웃 등
- 처벌의 효과: 행동을 억제 할 뿐 제거하지 못함
③ 소거(extinction): 목표행동 뒤에 아무런 보상이 제시되지 않음으로 목표행동이 사라지는 것
☞ 부적강화와 차이점: 부적강화는 어떤 자극이 제시되어 행동의 빈도와 강도가 높아지는 반면
소거는 아무것도 제시되지 않아 행동이 사라지도록 유도함
④ 행동조형(shaping): 대상이 원하는 행동으로 조금씩 접근하도록 유도하는 조작적 조건형성 절차
☞ 연속적 근사법(successive approximation): 유사한 행동에 가까울 때 강화물을 주는
행동조형 방법

2 강화 스케줄의 유형 및 응용 사례
1) 강화방법
(1) 연속강화
☞ 원하는 반응이 나타날 때마다 강화하는 것
- 단점: 현실적으로 누군가 늘 행동을 관찰하고 강화를 주는 것은 불가능함. 학습의 의도 왜곡 등
- 프리맥(Premack)의 원리: 자주 하는 행동은 드물게 하는 행동의 강화인이 될 수 있음


(2) 부분강화
☞ 부분적으로만 강화하는 것.
- 장점: 소거 저항이 강하며, 관리 비용이 적게 들어감


2) 강화스케줄: 강화의 패턴
(1) 구성 요소
☞ 고정/변동 × 간격/비율의 조합으로 4가지 스케줄이 나올 수 있음
- 고정(Fixed): 고정된 기간이나 횟수에 따라 강화하는 방식.
강화 후 휴지기(post-reinforcement pause)가 나타남
- 변동(Variable): 평균적인 시간이나 횟수에 맞추어 강화하는 방식
- 간격(Interval): 시간 기준
- 비율(Ratio): 횟수 기준

(2) 강화스케줄 유형
☞ 고정간격(FI) 계획: 일정 시간 후의 반응에 강화를 주는 계획
예: 월급
☞ 변동간격(VI) 계획: 예측 불가능한 시간경과 후의 반응에 강화를 주는 계획
예: 무작위 출석부르기
☞ 고정비율(FR) 계획: 특정한 수의 반응이 일어난 후에만 반응을 강화하는 계획
예: 커피쿠폰, 인센티브
☞ 변동비율(VR) 계획: 예측 불가능한 반응 수 이후의 반응에 강화를 주는 계획
예: 타임세일, 게임의 랜덤박스
v 조작적 조건화의 한계
w 자율성 제한: 사람은 누군가가 주는 보상을 바라며 사는 존재가 아님
w 새로운 가능성에 대한 차단: 보상은 없지만 가능성 있는 새로운 행동을 유발시키기
어려움
w 복잡한 지적과제 설명이 어려움: 언어와 같이 인간의 지적능력과 관련된 학습을
설명하기 어려움

3 관찰학습의 개념
1) 관찰학습(Observational Learning)
☞ 보상이 주어지지 않고 단순 관찰만으로도 학습이 일어남
- 대표학자: 반두라(Bandura)
- 관찰학습이 일어나는 조건: 행동을 보았다고 무엇이든 따라하지 않음
• 행동의 결과가 강화
• 긍정적이고 호감이 가고 존경스러운 모델
• 특징이나 특질이 자신과 비슷한 모델
• 모방할 수 있는 행동

2) 통찰학습(insight learning)
☞ 어떤 것의 내적 본질을 직관적으로 이해하는 학습 현상
- 대표학자: 쾰러(Kohler)
- 문제와 관련된 규칙을 이해하는데 필요한 패턴이나 사건의 중요성에 대한 갑작스런 나타남
- 통찰학습의 특성: 시행착오가 아니라 실무율(all-or-none)적으로 발생
- 창의적인 학습 및 문제해결 방법: 뛰어난 지적 업적의 성취방법





※ 부족하지만 글의 내용이 도움이 조금이라도 되셨다면, 단 1초만 부탁드려도 될까요? 로그인이 필요없는 하트♥(공감) 눌러서 블로그 운영에 힘을 부탁드립니다. 그럼 오늘도 행복한 하루 되십시오^^

반응형