행동수정

보육교사, 상담심리, 임상심리사, 심리학 등 행동수정 요점 요약 3. 행동수정이론1

롤라❤️ 2023. 4. 13. 08:11
반응형

3. 행동수정이론1

용어해설 :
- 무조건 자극(US, Unconditioned stimulus) : 이전의 학습이 없어도 무조건적인 반응을 나타나게 하는
자극
- 무조건 반응(UR, Unconditioned Response): 무조건 자극에 의해 나타나는 반응
- 중립자극(NS, Neutral stimulus): 아무런 반응도 유발하지 않는 자극
- 조건자극(conditioned stimulus): 조건형성이 형성 된 후에 조건 반응을 유발하는 자극
- 조건반응(conditioned Response): 조건형성이 형성된 후에 조건 자극에 나타내는 반응

1. 행동주의 학습이론
- 행동주의 학습이론(Behavioral theories of learning)은 인간행동 변화에 초점을 두고 변화를 촉진하는
자극, 강화를 정밀하게 계획하는 것
- 행동주의 학습이론은 지식 습득의 결과는 행동의 변화로 나타나며, 학습은 경험을 통해 소유한 무엇
때문에 발생하는 ‘ 행동의 지속적인 변화’ 를 의미함.

- 행동주의자들이 중요시 하는 몇 가지 전제
첫째, 환경이 인간의 행동에 강력하게 영향을 준다고 믿는다.
둘째, 행동주의자들은 외무에서 지우지는 보상이나 처벌과 같은 외적 자극이 매우 중요한 반면,
감정과 같은 내적 현상은 중요하지 않다고 생각한다.
셋째, 학습여부는 행동이 수행되느냐 아니냐로 판단할 수 있다고 가정한다. < 일부 행동주의자들
은 지식이나 조건화가 학습되었지만 아직 행동화되지 않은 잠재적 학습도 있을 수 있다고 주장하
기도 한다. >

 

1) 고전적 학습이론
- 러시아의 생리학자 파블로프가 발견한 학습원리로 고전적 조건화를 발견한 덕분에 1904년에 의학과
생리학 분야에서 노벨상을 받았다.
- Pavlov는 연구에서 개는 수일 안 여러 번의 검사를 연속적으로 받았다. 매회기 마다 동물에게 음식
이 주어지고, 타액을 측정하였다. Pavlov는 여러 차례 검사를 받은 개를 연구하던 중 중요한 사실을
관찰하게 되는데 실험실에 새로 들어온 피험 동물과는 다르게 경험이 많은 개는 음식이 제시되기 전
에 먼저 침을 분비하기 시작한다는 것이다.
- Pavlov는 개가 음식에 선행하여 규칙적으로 제시되었던 자극, 예를 들어 실험자의 출현에 침을 분비
하는 능력을 습득했다고 추론하게 된다.

⑴ 기본 가정
- 고전적 조건화에는 적어도 세 가지 가정을 가지고 있다.
⦁ 첫째, 인간의 행동을 변화시키는 원리는 동물의 행동을 변화시키는 윈리와 같다.
⦁ 둘째, 외부자극이 동물이나 사람의 행동을 이끌어내는 힘을 가지고 있다.
⦁ 셋째, 서로 다른 기능을 하는 두 가지 자극을 연합하면 동일한 기능을 하게 된다.


⑵ 주요개념 및 원리
① 고전적 조건화 과정
- 동물이나 인간은 어떤 자극에 대해 무조건적으로 반응하도록 프로그램화 되어 있다.
⦁ 예 > 음식을 보거나 냄새 맡으면 침이 자동적으로 분비된다.
바람이 강하게 불거나 물체가 날아오는 것은 눈을 자동적으로 감게 만드는 자극이다.
- 예를 통해 본다면 음식, 강한 바람, 날아오는 물체 등은 무조건 자극(US: Unconditioned Stimulus)이라
고 부른다.
- 무조건 자극에 대해서 아무런 저항 없이 일이키는 반응 즉, 눈을 감는다, 침이 분비된다 등을 무조건
반응(UR: Unconditioned Response)이라고 부른다.
- 무조건이라는 용어는 자극과 반응 간의 연결이 학습되지 않았다는 것(선천적)을 나타내기 위해 사용되었다.
- 개에게 종소리를 들려준다. 개는 종소리에 침을 분비하지 않는다. 이 때 종소리를 중성자극(특수한
반응을 이끌어내지 않는 것)이라고 한다. 종소리를 들려준 후 곧바로 고기를 제시한다. 그런 절차를
여러 번 반복하고, 개는 매번 침을 분비한다.
- 이번에는 전혀 고기를 제시하지 않고 종소리를 들려준다. 개는 침을 분비 한다. 중성자극은 조건자극
(conditioned stimulus :CS)이 되었고 그것에 대한 반응은 조건반응(conditioned Response: CR)이 되었다.

② 고전적 조건화가 발생하기 위해서 충족해야 할 원리.
- 무조건 자극과 조건 자극이 제시되는 순서가 중요하다. 조건 자극이 먼저 제시되고 무조건 자극이
제시되어야 조건화가 잘 일어난다.
- 조건자극과 무조건 자극 사이에 시간적 간격이 너무 크지 않아야 한다. 조건 자극이 제시되고 몇 초
이내에 무조건 자극이 제시될 때 조건적 조건화가 잘 일어난다. 조건자극과 무조건 자극 사이에 시
간적 간격이 너무 클 때 고전적 조건화가 일어나지 않는다.
- 조건자극과 무조건 자극 사이에 상관이 중요하다. 조건 자극이 있을 때마다 무조건 자극이 있고, 조
건 자극이 없을 때는 무조건 자극이 언제나 없다면, 조건 자극과 무조건 자극 사이의 상관은 100%이
다. 이런 100% 상관은 실험실 같이 일부러 만들 때만 가능하고, 실생활 속에서는 존재하지 않는다.
- 고전적 조건형성에 의한 학습이전의 상황과 학습이후의 상황

◆ 예
사례 1에서 날아오는 야구공에 불안을 느끼는 성우가 내일 하는 야구에서도 날아오는 공에 불안과 긴
장을 느끼는 것도 엄밀히 말하면 자극일반화라고 할 수 있다. 어제의 야구 경기와 오늘의 야구경기는
동일한 자극이 아니라 유사한 자극이다.
날아오는 야구공에 불안을 느끼는 성우는 날아오는 축구공에도 긴장과 불안 반응을 일으킨다. 축구도
공이기 때문에 일반화가 일어나는 것이다.

⒝ 변별(discrimination) : 일반화와 정반대의 과정으로 일반화가 유사한 자극에 대해 동일한 조건 반응을
일으키는 것이라면, 변별은 유사한 자극에 서로 다르게 반응을 하는 것을 말한다.

◆ 예
사례1에서 성우가 날아오는 야구공에는 불안과 긴장을 느끼지만 날아오는 탁구공에는 불안과 긴장을
보이지 않는다면 자극을 변별한 것이라고 할 수 있다.
객관식 시험에서 정답을 골라내는 것도 변별의 한 예이다.

⒞ 소거(extinction) : 조건반응이 영원히 지속되는 것이 아니다. 조건자극이 반응을 이끌어내는 힘을 상
실하는 것을 소거라고 한다.

◆ 예
고전적 조건화 과정에서 개에게 종소리를 여러 번 들려주고 고기를 전혀 주지 않으면, 개는 서서히 침
흘리는 반응을 하지 않는다.

 

참고 : 고전적 조건화가 자주 일어나는 것은 공포, 불안 같은 정서적 반응인데, 정서반응은 한번 조
건화가 되면 소거가 잘 일어나지 않는다. 학교자체는 중성자극이지만 불안, 공포에 대한 무조건 자극
인 무서운 분위기와 반복적으로 연합되면(학교에 가면 혼난다, 학교에 가면 친구가 때린다) 학생들은
학교에 대해 불안이나 공포와 같은 조건반응을 하게 된다. 따라서 이 때 불안, 공포 등과 같은 부정
적 정서는 소거가 잘 일어나지 않는다.


⒟ 자발적 회복(spontaneous recovery) : 소거가 일어난 후 일정 기간이 지난 후 조건 자극을 제시하면
조건 반응이 다시 나타나는 경우를 말한다.

◆ 예
사례 1의 성우는 소거를 통해서 날아오는 야구공에 대한 불안과 긴장 반응이 소거되었다. 그 덕분에
야구경기에 참여도 하고 즐길 수 있게 되었는데, 롯데와 기아 경기를 관람하기 위해 경기장에 갔을 때
홈런볼이 자신에게 날아오는 것을 보고 갑자기 불안을 느끼기 되는 것을 자발적 회복이라고 한다.

 

⒠ 재조건 형성(reconditioning): 자발적 회복이 생긴 후 조건자극과 무조건 자극을 짝지어 제시하면 다시
원래 강도의 조건형성이 이루어짐.
⑶ 파블로프 이론에 대한 평가
- 동물실험의 결과를 그대로 인간에게 적용할 수 있는가?
- 파블로프의 고전적 조건형성은 기본적으로 인간을 수동적인 존재로 파악하였기 때문에 인간성의 한
측면에만 국한 된 견해라는 비판
- 인간학습에 널리 적용되고 있으며 아동의 양육 및 교육, 그리고 임상적 심리치료에 기여한 공헌은
긍정적인 평가를 받고 있음.


2) 도구적 학습이론
⑴ 손다이크의 도구적 학습이론
① 손다이크의 실험
- E. L. Thorndike(1898)는 동물의 비 반사적 행동이 경험의 결과로 어떻게 수정되는지 체계적으로 연
구한 학자
- 배고픈 동물(고양이, 개, 병아리)를 문제상자에 넣고 동물이 적절하게 반응하면 문제상자의 문이 열리
고 동물은 빠져나가 문밖 바로 곁에 놓아둔 먹이를 먹을 수 있다.
- 동물에게 요구되는 반응은 줄 당기기, 레버 누르기 또는 발판 밟기처럼 단순하다.

고양이에게는 3가지 행동을 하도록 요구된다. 첫 번째, 줄당기기(고리가 하나 열린다), 발판밟기(다른
고리가 열린다), 막대 사이로 앞발을 뻗어 문 앞에 있는 두 빗장중 하나를 돌리기를 하는 것이다.
처음 문제상자에 고양이를 넣으면 빠져나오는데 시간이 오래 걸리지만 고양이는 아무렇게나 상자의 여기저기를 탐색하다가 결국 문을 연는 반응을 한다.
손다이크는 동물이 처음으로 적절한 반응을 하게 되는 것은 순전히 우연에 의한 것이라고 결론지었
다.

그래프에서 보는 것과 같이 처음 시행에서 고양이가 상자를 탈출하는데 걸린 시간은 160초였다. 24
번 시행 후에는 단 7초가 걸렸다.
상자에 처음 들어갔을 때 매우 불규칙한 반응을 보이던 고양이는 차츰 규칙적인 반응을 하게 됨
처음의 시행착오 반응이 점점 줄어들어 상자를 빠져나와 먹이로 보상받을 수 있는 반응을 학습하게
되는 것. 이러한 학습과정을 도구적 조건형성이라고 함.
② 조건화가 이루어지는 3가지 학습원리
- 효과의 법칙(law of effect)
효과의 법칙은 반응에 대한 결과가 만족스러우면 자극-반응간의 결합이 더 잘 일어나고(즉 학습이
잘 되고), 불만족스러우면 결합은 약화된다는 학습 원리이다.
또한 결과물에 대한 만족도 즉 보상의 크기가 클수록 자극-반응간의 결합은 더 강화되어 학습이 잘
일어난다.
원래 손다이크는 보상은 결합을 강화시키지만 벌은 결합을 약화시킨다고 주장하였지만 1930년 이후
보상은 결합을 강화시킨다는 입장은 고수하였고 벌이라는 결과가 필연적으로 자극-반응의 결합을 약
화시키지는 않는다고 효과법칙의 일부를 수정했다.
- 연습의 원리
학습이 성립되기 위해서는 반복연습에 의한 특정반응의 성립과 문제사태와의 결합의 강도를 높일 필
요가 있다. 즉 연습을 많이 하면 결합이 강화되고 연습을 하지 않으면 결합이 약화된다는 것이다. 이
원리 또한 1930년대 이후 피드백이 없이 단지 연습만으로는 학습을 개선할 수 없음을 실험을 통해
입증하였고 연습의 원리를 폐기하였다.
- 준비성의 원리
준비성의 원리는 어떤 행동을 행할 준비가 미리 갖추어져 있을 때 행동을 하면 만족감을 주고, 준비
가 갖추어져 있지 않은 상태에서의 행동은 불만족을 가져온다. 따라서 행동이 자율적이지 않고 강요
될 때 그 행동을 하지 않게 되거나 적극성을 띠지 못하게 된다는 것이다.


3) 조작적 조건형성
- 스키너에 의해 개발된 학습원리로서 미국의 행동주의 심리학 발달을 주도했다.

 

⑴ 기본 가정
- 첫째, 동물의 행동을 변화시키는 원리와 인간의 행동을 변화시키는 원리는 동일하다.
- 둘째, 동물이나 인간은 목표를 달성하기 위해 다양한 행동을 한다.
7)
- 셋째, 동물이나 사람은 자극에 수동적으로 반응하기 보다는 능동적으로 행동하여 그 결과에 따라 다
르게 행동한다.
8)
⑵ 주요개념 및 원리
① 스키너의 실험(조작적 조건화 실험)
- 유기체가 주어진 과제를 수행할 수 있도록 하기 위해서 실험 전 일정기간 동안 먹이를 주지 않고 굶
주린 상태를 만든다.
- 굶주린 상태에 있는 쥐를 스키너 상자에 넣고, 실험자가 주기적으로 스위치를 조정하여 먹이가 먹이
통에 떨어지기 직전에 찍찍거리는 소리를 들려주면 유기체는 찍찍거리는 소리와 먹이가 나타난다는
사실을 점차 결합시키게 된다.
- 그런 후에 유기체를 스키너의 상자 속에 다시 넣으면 유기체는 이리저리 돌아다니다가 우연히 지렛
대를 누르게 되고, 그 결과 먹이가 제공되면 지렛대를 누르는 행동이 강화되기 때문에 이러한 조작
행동의 빈도가 증가하게 된다.
- 많은 조작행동 중에서 어느 한 가지 행동(이 경우에는 지렛대를 누르는 행동)만을 반복해서 강화함으
로써 그 행동이 다시 나타날 가능성을 높여주는 것이며(이 때 강화 받지 못한 행동은 점차 소거된다)
이를 조작적 조건화라고 한다.

② 기초적인 행동규칙
- 긍정적인 환경영향(긍정적 강화, 보상)에 따르는 행동은 빈도수가 증가한다.
- 부정적 환경영향(부적강화)의 감소에 따르는 행동은 빈도수가 증가한다.
- 부정적 환경 영향(체벌)에 따르는 행동은 빈도수가 감소한다.
- 강화를 통해서 빈도수가 증가한 행동은 강화가 사라지면 빈도수가 줄어든다.
③ 스키너의 실험을 통한 강화원리
⒜ 행동의 구체적 형성
- 스키너의 상자에서 중요한 것은 쥐가 지렛대를 누르도록 그냥 기다리는 것이 아니라 빨리 지렛대를
누르는 동작에 도달할 수 있도록 근접행동이 나올 때마다 보상을 줘야 한다.

- 쥐가 지렛대쪽으로 돌아서면 먹이를 준다.
- 그쪽을 쳐다볼 때마다 지렛대쪽으로 앞발을 치켜들면 먹이를 준다.
- 이와 같은 연속적 접근 방법을 통해 목표행동이 구체적으로 형성되도록 한 단계씩 보상해 나가는 것
을 말한다.
⒝ 부분보상 대 전체보상
- 처음에 쥐가 지렛대를 누를 때마다 먹이를 주는 전체적 보상을 사용, 이후에는 적당한 횟수, 간격을
두고 먹이를 주는 부분적 보상을 실시함
- 결과 : 전체적 보상은 행동을 빨리 변화시키기 때문에 학습초기에 효과적이지만 학습된 행동을 강화,
유지하기 위해서는 부분적 보상이 훨씬 더 효과적
⒞ 강화유형과 강화계획
- 강화조건을 여러 가지 형식에 따라 조절하면 각각 다른 반응현상이 나타남.
- 강화조건의 패턴을 강화계획이라고 함
- 각 행동마다 강화물을 주는 계속강화, 가끔씩 강화하는 간헐강화가 있고 이 두가지 기본 패턴은 시
간 및 반응수의 고정과 변동에 따라 네가지 유형으로 분류됨.
강화(reinforcement): 어떤 행동의 발생빈도를 증가시키는 과정
정적강화(positive reinforcement) : 유기체가 바람직한 행동을 한 후에 유기체가 좋아하는 것을 보
상함으로써 그 행동의 발생빈도를 증가시키는 과정
예> 행동 후에 주어지는 칭찬과 장학금
부적강화(negative reinforcement): 유기체가 바람직한 행동을 한 후에 유기체가 싫어하는 것을 제
거하거나 감소시켜 줌으로써 행동의 발생빈도를 증가시키는 과정
예> 선행을 한 학생에게 방과 후 청소를 면제 시켜주는 것
계속적 강화계획 : 특정 행동을 할 때마다 매번 강화물을 제공하는 것
간헐적 강화계획
ü 고정간격(fixed interval: FI): 일정한 시간 간격을 두고 강화물을 제공
ü 정해진 시간이 이전에 발생되는 행동은 강화받지 못하고 정해진 시간 이후에 발생하는 첫 번째
행동에 강화물이 주어진다.
[예] 수학문제 하루 5문제씩 풀기를 숙제로 내주었다. 그리고 검사는 2주째 토요일마다 할 것이
라고 공지하였다. 학생들은 2주째 토요일이 오기 전까지 미뤘다가 정해진 기간이 오면 미뤄왔던
것을 열심히 할 것이다.
ü 변동간격(variable interval: VI): 다양한 시간 간격을 두고 강화물을 제공. 미리 정한 시간간격이
지난 후에 강화물이 주어지는데, 그 간격은 매 강화마다 다르고, 한 강화에서 다음 강화가 일어
난 시기를 예측할 수 없다는 점을 제외하고는 고정간격 강화계획과 유사함
[예] 한 달에 한번 정확한 날짜를 정해두지 않고 예고 없이 공책검사를 하여 필기가 잘되어 있는
사람에게 플러스 점수를 준다고 한다. 그러면 언제 검사할지 모르기 때문에 항상 꾸준하게 공책
필기를 열심히 하게 될 것이다.
ü 고정비율(fixed ratio:FR): 정해진 횟수만큼 행동을 할 때 강화물을 제공.
[예] 매주 발표를 3번하면 플러스 점수를 준다. 그리고 한달 안에 발표 10번을 채우면 상품을 받
게 한다. 학생들은 발표 횟수를 채우기 위해 발표를 많이 하려고 할 것이다.
ü 변동비율(variable ratio: VR): 비율이 일정하지 않아도 강화물을 제공. 강화로 인해 요구되는 반
응의 평균량이 서서히 증가할 경우에 높은 반응비율이 나타나는 현상은 변동비율 강화계획의 특
징이다. 변동비율 강화계획을 훈련 프로그램에 적용했을 때 고정비율 강화계획보다 두 가지 장점이 있다.
변동비율 강화에서는 고정비율 강화와는 달리 강화 후에 휴식이 거의 없거나 전혀 없다.
변동비율 강화에서는 행동의 약화나 퇴보의 문제를 유발하지 않고도 강화에 요구되는 행동의 양
을 크게 증가시킬 수 있다.
[예] 발표를 많이 한 학생에게 플러스 점수와 선물을 준다. 하지만 선정하는 정확한 날짜를 정해
두지 않는다. 그러면 학생들은 언제 뽑을지 모르기 때문에 계속적으로 발표를 많이 하려고 노력
할 것이다.

- 행동수정에서는 고정비율 강화계획을 사용한다. 예를 들면, 일정량의 수학문제를 풀거나 일정양의 책
을 읽어야 할 경우 고정비율 강화계획을 적용한다. 행동수정에서 고정비율 강화계획을 사용하는 이유

⦁ 간헐강화는 부분적으로 강화를 운영하기 때문에 계속강화보다 반응비율이 높다.
간헐강화는 포화가 서서히 일어나서 계속강화보다 강화물이 오래 유효하기 때문에 소멸 역시 천천
히 일어난다.
고정비율 강화계획에 따라 훈련을 하게 되면 훈련 상황 밖에서 일어나는 간헐강화에 의해 표적행
동이 유지되는 것을 돕는다.
⒟ 강화물의 종류
- 정적 강화물과 부적강화물
정적강화물 : 어떤 행동에 대한 조건으로 제시하여 행동이 일어날 확률을 증가시키기 위해서 음식,
돈, 칭찬 등을 제공하는 것
부적강화물: 어떤 행동에 대한 조건이 제시되지 않았을 때 행동을 발생시킬 확률을 증가시키는 것
으로서 반응 다음에 불쾌감이 제거되어 반응을 강화시키는 것
일차적 강화물 : 먹이나 물처럼 이전의 특별한 훈련이 없이도 학습자의 행동을 강화시키는데 효과
적인 자극으로 미각, 배고픔, 갈증 등과 관련되어 있다.
이차적 강화물 : 원래는 중성자극이었던 것이 강화하는 능력을 지니고 있는 다른 자극과 짝 지워
짐으로써 강화능력을 얻게 되는 것으로 학습된 강화물이다. 돈, 칭찬, 격려, 애정, 승진, 포상 등.


⒠ 벌과의 구별
- 벌(Punishment): 어떤 행동의 발생빈도를 감소하게 하는 과정
- 수여성(presentation) 벌: 바람직하지 않은 행동을 한 후에 불쾌한 자극을 제공
예> 체벌, 꾸중
- 제거성(removal) 벌 : 바람직하지 않은 행동을 한 후에 유쾌한 자극을 제거

예> TV시청 금지, 스마트폰 사용 30분 금지

◆ 정적강화, 부적강화 및 벌의 관계

자극 가(제공) 감(제거)
정적 강화물 정적 강화
(칭찬, 선물, 용돈)
제거성 벌
(스마트폰보지 못한다)
부적 강화물 수여성 벌
(체벌, 꾸중)
부적 강화
(청소면제, 숙제면제)

⒡ 조작적 조건형성의 원리 적용
- 강화의 원리 적용
- 바람직한 행동을 할 때는 칭찬하여 바람직한 행동을 강화한다.
- 강화의 효과는 개인차가 있다.
- 강화는 행동 직후에 제시한다.
- 작은 강화물을 자주 주는 것이 큰 강화물을 가끔 주는 것보다 효과적이다.
- 바람직한 행동을 한 후에 강화를 준다
- 노력에 상응하는 보상을 준다.
⒢ 벌의 적용
- 강화행동은 행동의 빈도를 증가시키지만 벌은 행동을 감소시키거나 저지하기 위해서 사용된다는 점
에서 차이가 있다. 흔히 벌과 부적강화를 혼동하기 쉽다. 이 두 가지는 전적으로 그것이 행동에 대해
갖는 결과에 따라 구분된다. 즉 벌은 그에 선행하는 행동을 감소시키는 결과를 가져오지만 부적강화
는 선행하는 반응을 증가시킨다는 것이다.
벌의 유형은 수여성 벌 또는 적극적인 벌과 제거성 벌 또는 소극적인 벌의 2가지 유형이 있다.
벌을 적용할 때는
수여성 벌 대신 제거성 벌(time-out, empty chair)을 사용하라.
제거성 벌이 강화로 사용될 수도 있다.
그릇된 행동의 동기가 강할 때는 벌 보다는 강화인을 찾아서 없애주는 것이 더 효과적이다.
⒣ 강화계획의 적용
- 계속적 강화계획을 사용하다 강화가 중단되면 소겨현상이 나타날 수 있다.
- 간헐적 강화계획은 소거현상이 덜 일어난다.
- 고정 강화계획을 사용하면 대상자가 강화물 제공의 시점을 알게 되고
- 변동강화계획을 사용하면 대상자가 불안해 할 수 있다.


◆ 고전적 조건형성과 조작적 조건형성의 비교

  고전적 조건형성 조작적 조건형성
행동 비자발적
인간은 행동을 조직하지 않는다.
자발적
인간은 행동을 조직한다.
순서 행동은 자극의 뒤에 온다 행동은 자극(결과)에 앞선다
학습은 어떻게
발생하는가?
중성적인 자극이 무조건 자극과
연합될 때
행동의 결과가 차후의 행동에 영향을
미친다.
학습자가 교실(중성자극)을 교사의
따듯함과 연합하면 교실이 긍정적인
정서를 유발한다
학습자가 질문에 답을 하면 칭찬이
주어지고, 그러면 답을 하려는 시도는
증가한다


반응형