사회복지자료/사회복지관련자료

스키너의 조작적 조건형성

구원의 계획 2013. 10. 28. 00:01

스키너의 조작적 조건형성

 

파브로브와 왓슨의 고전적 조건형성에서 유기체는 조건형성 되는 동안 수동적이다. 스키너의 조작적 조건형성(operant conditioning)의 전조는 쏜다이크(Edward L. Thorndike, 1874~1949)가 확립한 도구적 조건형성(instrumental conditioning)이었다. 쏜다이크는 유기체가 시행착오학습을 통해 반응경향성을 갖게 되거나 상실하는 효과의 법칙에 따라 학습한다는 것을 발견하였다. 스키너의 조작적 조건형성은 당신이 하는 행동에 따라 보상을 받거나 처벌된다는 기본적 가정에 입각한다. 따라서 당신이 하는 능동적인 자세 또는 행동 결과의 중요성을 정교화한 것이다. 스키너가 강조하는 기본적인 원칙은 ‘행동은 그것의 결과에 의해 조정되고 유지된다’는 것이다.

스키너는 동물이 보이는 반응이 환경에 어떤 조작을 가하여 강화물을 초래한다는 의미에서 이런 반응을 ‘조작행동’이라고 불렀다. 스키너는 행동의 조성과 유지에서 환경의 역할을 강조하였다.

스키너는 인간에 대해 기계론적 입장을 취한다. 그는 ‘인간을 원리나 법칙에 따라 행동하는 복잡한 체계인 유기체’로 여겼다(Schultz & Schultz, 1998).

스키너는 행동을 유발하는 원인 혹은 추동이 외부 요인의 영향이라고 생각하였다. 무의식, 방어기제, 특질 등의 개념은 관찰될 수 없기 때문에 과학으로서의 심리학의 영역에 포함될 수 없다고 스키너는 주장하였다. 이러한 내적 추동은 가설적인 개념이기 때문에 철학이나 신학에서 다루어야 할 개념으로 여겼다. 스키너는 인간을 ‘비어있는 유기체’로 보았다. 이는 우리의 행동을 과학적으로 설명하기 위해 살펴 볼 수 있는 것은 우리 내부에는 존재하지 않는다는 의미이다.

이러한 맥락에서 인간은 오랜 과거경험에서 비롯된 강화의 산물이라고 보았다. 다시 말하여 보상을 받은 행동은 지속될 것이고, 보상받지 못한 행동 혹은 처벌받는 행동은 사라질 것이다. 우리의 행동은 강화와 처벌의 법칙에 따르고 통제된다.

스키너는 다른 성격이론가들과는 달리, 개인차에 대해 관심을 두지 않았다. 그는 인간 행동의 보편적 법칙을 발견하는 것이 목적이었다. 그는 자극과 반응간의 관계를 설명하는 고정불변하는 경험적 진술을 원하였다. 사람들간에 개인차가 존재한다면, 반응을 유발하는 자극이 서로 다르기 때문이라고 여겼다. 자극을 반응과 연관시키는 규칙은 변하지 않는다.

자신의 이러한 입장을 주장하기 위해 스키너가 연구한 대상은 사람이 아니라 동물이었다. 몇몇 성격이론가들은 정서적으로 문제가 있는 사람들을 대상으로 이론을 발달시켰고, 다른 이론가들은 평균적인 정상인들을 대상으로, 어떤 이론가는 가장 영리하고 성공한 사람들을 대상으로 이론을 발달시켰다. 스키너는 보편적인 법칙을 발견하기 위해서는 통제하기 쉽고 행동의 기제가 단순한 동물들을 연구하여 인간 행동을 설명하는 것이 보다 많은 이점이 있다고 생각하였다.

비록 스키너의 이러한 주장들이 많은 사람들의 논란을 불러 일으켰지만, 오늘날 심리학 분야에서 그의 중요도와 영향력은 매우 크다고 볼 수 있다.

1. 스키너의 생애

행동주의의 대표적 인물은 스키너이다. 20세기에 가장 영향력 있는 심리학자 대열에 있었던 것으로 평가받고 있는 스키너(Fredrick B. Skinner, 1904-1990)는 1904년 펜실베이니아 주 서스퀴하나(Susquehanna)의 부유한 가정에서 두 명의 아들 중 큰아들로 출생하였다. 변호사인 아버지는 스키너의 출생을 지역신문을 통해 알렸다. 그의 부모는 아들들에게 적절한 행동규칙을 주입했던 열심히 일하는 사람들이었다. 스키너를 법학도로서 만들려 했던 아버지의 모든 노력은 수포로 돌아가고, 스키너는 영어를 공부하기 위해 해밀턴(Hamilton)대학에 입학하였다. 그는 직업으로 변호사가 아니라 작가가 되기를 희망했다. 졸업 후 2년 동안 글을 쓰는데 기여했으나 자신에게 작가로서의 소질이 없음을 발견하고는 작가의 꿈을 포기하였다.

스키너는 소설보다는 과학적 방법으로 이간을 연구하기로 결정하고, 1928년 심리학을 공부하기 위해 하버드 대학 대학원에 입학하였다. 스키너는 심리학으로 관심분야를 바꿀 때 “인간 행동에 대한 나의 관심은 여전하지만, 문학적 방법에 있어서는 실패하였다. 나는 과학으로 바꾸었으며, 비록 잘 알지만 못하지만 관련된 과학이 심리학인 것 같다”라고 적었다(Skinner, 1967,p.395). 그로부터 3년 후인 1931년에 박사학위를 받았다. 그의 행동주의의 선택은 작가로서 묘사하려고 했던 모든 감정 및 정서적 힘을 배제하도록 이끌었다.

1936년까지 하버드 대학에 머물러 연구를 한 후, 미네소타 대학과 인디애나 대학에 재직했으며, 그 뒤 다시 1947년에 하버드 대학으로 돌아와서 교직생활을 마감하였다.

1930년대 중에 스키너는 실험연구를 통해 흰쥐를 이용하여 학습원리를 개발하는데 노력하였다. 흰쥐를 이용한 그의 연구결과는 ‘유기체의 행동’(The Behavior of Organisms)이라는 책으로 출판되었다. 실험심리학에 있어서 그의 가장 중요한 기여는 아마도 일반적으로 ‘스키너 상자’(the Skinner box)라고 불리는 장치의 발명이었다. 스키너 상자는 동물(주로 쥐와 비둘기)의 자발적 행동을 분석하기 위한 실험장치로, 이 실험에 의해 새로운 학습실험의 형식이 생겨났다고 할 수 있다. 이 실험장치는 스키너가 강화라고 불렀던 것을 받기 위해 동물이 새장에 붙어 있는 지렛대를 누르도록 고안된 장치이다. 나중에, 스키너와 다른 연구자들은 이 장치를 비둘기, 원숭이, 인간, 그리고 다른 다양한 유기체에 적용하였으며, 이 장치는 지금도 다양한 학습원리를 실험하는데 사용되고 있다.

스키너는 1940년대 중에 작가로서 실패한 정체감으로 중년의 위기를 경험하였는데, 1948년에 그의 인간행동에 대한 강화 원리에 근거하여 이상사회를 묘사한 월덴투(Walden Two)라는 소설을 통해 자기치료를 하였다. 1953년 초에, 스키너는 인간행동에 그의 생각을 적용하였는데, 이 내용을 담고 있는 것이 ‘과학과 인간행동’(Science and Human Behavior)이라는 책이었다.

스키너는 1957년에 페스터(Charles Ferster)와의 공동작업에서 강화계획이라는 책을 출판했는데, 이것은 강화가 모든 반응에 주어질 필요가 없으며, 시간과 비율에 의해 프로그램 될 수 있다는 것을 보여준다. 같은 해에. 그는 ‘언어행동’(Verbal Behavior)을 출판했으며, ‘자유와 존엄을 넘어서’(Beyond Freedom and Dignity)라는 책은 베스트 셀러가 되었다. 그러나 그는 문학과 관련하여서는 별다른 평을 받지 못했다. 1970년대 후반과 1980년대 초에 걸쳐 그는 세 권의 자서전, 즉 ‘Particulars of my Life'(1976), 'The Shaping of a Behaviorist'(1979), 'A Matter of Consequences'(1983)를 출간하였다. 그는 1990년에 죽을 때까지 자기가 발견한 강화원리를 강조하면서 타임지에 “노병은 아직 죽지 않았다”란 표현으로 그의 입장을 기술하였다. 아무튼 스키너는 죽기 바로 직전까지 글을 쓰고 강연을 계속하였다.

행동주의의 창시자인 왓슨처럼, 스키너의 생각도 논란의 대상이 되어왔다. 스키너는 죽을 때까지 급진적인 행동주의자의 입장을 고수하였다. 그의 입장에 동감하는 사람들은 누구보다도 그가 과학으로써의 심리학을 발전시켰다고 믿는다. 그는 인간행동의 연구에 철저하게 객관적인 접근을 주장했으며, 관찰할 수 없는 무의식, 자유의지, 인지 등을 강조하는 정신분석, 인본주의, 인지심리학의 입장에 반대하였다.

2. 주요 개념

여기에서는 스키너의 주요 개념으로 성격없는 성격이론, 조작적 조건형성, 강화계획, 변별과 일반화, 소거, 조성 등을 살펴보고자 한다.

◎ 성격 없는 성격이론

스키너는 인간이 아니라 단지 인간에게 영향을 주는 환경 내의 변인과 힘에 초점을 두고 직접적으로 관찰될 수 있는 행동을 연구하였다. 그는 개인의 행동을 결정하고 유지시키는 환경적 결과에 집중해야 한다고 제안하였다. 관찰할 수 있는 행동은 환경에 있는 요인에 대한 반응에 의해서 충분히 이해될 수 있다는 것을 강조했다. 따라서, 스키너에게 ‘성격’이란 용어는 필요 없는 말이었다. 그에게 성격 혹은 자아와 같은 내적 구조에 의해서 행동을 이해하거나 설명하려는 노력은 과학이 아니라 허구를 얘기하는 것이었다.

스키너는 성격을 행동패턴의 집합이라고 정의하였다. 이런 점에서 일반적으로 다른 성격이론에서 가정하는 관찰할 수 없는 ‘자아’, ‘특질’등의 개념은 행동의 과학적 분석을 강조하는 스키너의 이론적 체계에서 연구대상의 아니었다. 다른 상황은 다른 반응패턴을 야기한다. 개인의 반응은 단지 이전 경험에 근거한다. 스키너는 정신적 상태를 찾는 것은 잘못된 것이라고 기술하면서, 프로이트가 연구주제로서 내적 정신을 강조함으로써, 과학을 50년 퇴보시켰다고 지적하였다(Skinner, 1953).

이처럼 스키너의 행동적 접근은 지금까지 논의해온 다른 성격이론의 가정과는 매우 다르다. 즉 그는 인간이 갖는 어떤 경향성을 무시하고 오직 어떤 상황에서 비롯되는 행동과 그것의 결과를 강조함으로써 실제로 성격이론을 구성하는 것을 거부하는 입장을 취했다. 이런 점에서 그의 입장을 아이러니컬한 제목인 '성격 없는 성격이론‘으로 여기에 제시하는 이유는 그가 과학적으로 인간행동을 설명하는데 막대한 영향을 끼쳤기 때문이다.

◎ 조작적 조건형성

스키너는 행동을 두 가지 유형인 반응행동(respondent behavior)과 조작행동(operant behavior)을 구분하였다. 반응행동은 자극에 의해서 야기되는 반사 혹은 자동적 반응을 의미한다. 예를 들면, 밝은 불빛에 눈의 동공수축, 무릎 정수리를 두들기면 나타나는 무릎반사 혹은 뜨거운 냄비에 모르고 손가락을 댔다가 반사적으로 손을 끌어당기는 행동을 말한다. 이러한 행동은 학습된 것이 아니라 불수의적 및 자동적으로 야기된다. 이러한 반응행동은 학습을 통해서 조건형성 되거나 변화될 수 있다. 파브로브는 무조건자극(고기덩어리)과 조건자극(중립자극: 종소리)을 연합시켜 개에게 반복적으로 제시한 후에 무조건자극 없이 단지 조건자극에 의해 조건반응(타액분비)을 유발하게 하는 고전적 조건형성을 확립하였다.

조작행동은 제시되는 자극이 없이 방출되는 반응이다. 즉 자발적으로 나타나는 행동이다. 조작행동은 반응에 따르는 사건에 의해 강해지거나 약해진다. 반응행동이 선행사건에 의해 통제되는 반면에 조작행동은 그것의 결과에 의해 통제된다. 즉 조작행동은 행동이 완성된 후에 일어나는 결과에 의존해서 통제된다. 즉 조작행동은 행동이 완성된 후에 일어나는 결과에 의존해서 일어나는 조건형성 되어진 행동이다. 스키너는 이렇게 행동의 결과에 의해 특별한 행동을 조성하고 유지시키는 과정을 조작적 조건형성이라 불렀다. 다시 말하면, 조작적 조건형성은 행동과 그것의 결과의 연합을 통해 조작행동을 형성하는 절차이다. 많은 행동이 고전적 조건형성에 의해 설명될 수 없기 때문에, 스키너는 조작적 조건형성의 과정이 단순한 고전적 조건형성보다 훨씬 의미가 있고 중요하다고 믿었다.

요약하면, 반응행동은 어떤 자극에 의해 야기되거나 유발되는 반응을 말한다. 반면에 조작행동은 유기체가 자유롭게 자발적으로 하는 반응을 말한다. 강화(reinforcement)의 본질도 역시 두 조건형성에서 다르다. 고전적 조건형성에서, 자극이 강화이며 그것은 행동에 선행한다. 이에 반해, 조작적 조건형성에서는 행동의 효과가 강화이다. 그러므로 강화는 행동에 뒤이어 나타난다.

수반성 반응과 그것의 결과간에 확립될 수 있는 특별한 관계를 강화 혹은 처벌의 수반성(contingency)이라고 한다(Catania, 1988, p.5). 수반성은 어떤 사건(A)이 만약 달느 사건(B)이 일어나면 야기될 것이라는 것을 진술하는 규칙이다. 예를 들면, 자녀가 방을 깨끗이 치우면(B), 그는 용돈을 받을 것이다(A). 세 가지 용어인 자극, 반응, 결과간의 관계에 의존하는 행동이 변별화된 조작행동이다. 그러므로, 변별화된 조작행동은 일반적으로 ‘세 가지 용어 수반성’(three-term contingency)에 의해 정의된다. 부연 설명하면, 조작적 조건형성에서 수반성에 필요한 세 가지 중요한 구성요소가 있다. 첫째 구성요소는 자극(stimulus)이다.

여기서 자극은 반응 혹은 행동이 일어나는 환경적 혹은 상황적 사건을 말한다. 둘째 구성요소는 행동(behavior)그 자체이다. 셋째 구성요소는 결과(consequence)이다. 여기서 결과는 행동에 뒤따르는 환경적 자극이다(Skinner, 1953 )

강화 스키너의 조작적 조건형성의 핵심개념이 강화(reinforcement)이다. 강화는 어떤 행동에 뒤따르는 사건(결과)이 그 행동을 다시 야기할 가능성을 증가시킬 때마다 일어난다. 즉 반응의 빈도를 증가시키는 것을 강화라 한다. 그렇게 반응을 증가시키는 결과를 강화물(reinforcer)이라 한다.

강화는 정적 강화(positive reinforcement)와 부적 강화(negative reinforcement)가 있다. 정적 강화는 행동이 정적 강화물에 의해 뒤따를 때 반응의 빈도가 증가하는 것을 말한다. 부적 강화는 행동에 뒤따르는 혐오자극을 제거함으로써 반응의 빈도가 증가하는 것을 말한다. 요약하면, 강화의 원리는 정적 강화물의 제시나 부적 강화물인 혐오자극의 제거가 행동에 뒤따를 때 반응의 빈도가 증가하는 것을 말한다.

처벌 처벌은 어떤 행동에 뒤따르는 결과가 그 행동을 다시 야기할 가능성을 감소시킬 때마다 일어난다. 즉 반응의 결과가 뒤따르는 반응의 빈도를 감소시키는 것을 처벌(punishment)이라 한다. 체벌, 전기쇼크, 큰소리 등과 같이 반응을 감소시키는 자극을 처벌물(punisher)이라 한다.

강화처럼 처벌에도 정적 처벌(positive punishment)과 부적 처벌(negative punishment)이 있다. 정적 처벌은 행동이 혐오자극에 의해 뒤따를 때 반응의 빈도가 감소하는 것을 말한다. 행동에 뒤따르는 긍정적 자극을 제거함으로써 반응의 빈도가 감소하는 것을 부적 처벌이라 한다. 거짓말의 대가를 치르게 하기 위해 아이가 좋아하는 장난감을 뺏어버리는 것과 같은 부적 처벌을 반응대가(response cost)라고 한다. 또한 일정 기간동안 모든 긍정적 자극을 제거해 버리는 부적 처벌을 ‘강화로부터 타임아웃’(time out from reinforcement)이라고 한다. 요약하면, 처벌의 원리는 혐오자극 제시나 긍정자극의 제거가 행동에 뒤따를 때 반응의 빈도가 감소하는 것을 말한다.

반응 혹은 행동의 증가

반응 혹은 행동의 감소

제공

정적 강화물: 음식, 고기덩어리, 칭찬, 상, 안아주기 등

정적 처벌물: 전기쇼크, 신체적 고통, 야단치기 등

제거

부적 강화물: 고통스러운 결과를 줄 수 있는 것을 없애줌

부적 처벌물: 기쁨이나 만족을 주는 것을 제거시킴

◎ 강화와 처벌의 차이

최근에 다시 학생들에 대한 체벌을 허용한다는 정부방침과 더불어 많은 논란이 진행중이다. 학교에서 학생들에게 가하는 체벌에 대한 금지가 내려진 뒤로 적지 않은 교사들이 학생을 지도하기가 힘들다고 주장하는 입장이 반영 된 듯 하다. 자녀를 지도하는 부모 혹은 학생들을 지도하는 교사는 그들을 훈육(discipline)하는 게 필요하다. 물론 훈육의 방법으로서 강화 혹은 처벌을 사용할 수 있다. 신체적 혹은 심리적으로 상처를 주는 정적 처벌의 네 가지 부정적인 결과는 다음과 같다(Nemeroff & Karoly, 1991)

첫째, 처벌은 부적절한 행동을 제거하기보다 단지 일시적으로 부적절한 행동을 억압한다.

둘째, 처벌하는 사람과 처벌되는 상황 그 자체가 고전적으로 조건화된 혐오자극이 되도록 처벌하는 자극은 공포를 유발할 수 있다.

셋째, 처벌은 문제를 다루는 방법으로써 폭력을 사용하는 것을 입증하거나 본보기에 기여할 수 있다.

넷째, 처벌 절차가 하지 말아야 하는 것을 단순히 보여준다는 점에서 유익하지 않다.

이러한 이유 때문에 바람직한 행동을 증가시키는 것에는 처벌보다 강화가 효과적이다. 그러나 부적절한 행동의 감소를 위해서는 처벌을 사용하되 위에서 언급한 부정적 결과를 고려하면서 사용하는 것이 바람직하다.

◎ 강화계획

아주 드문 반응이 강화되었을 때조차 그러한 행동이 유지될 수 있다는 발견을 통해 강화계획에 대한 탐구가 이루어졌다. 강화가 주어지는 수반성에 대한 진술이 강화계획(schedules of reinforcement)이다. 즉 행동을 통제하기 위해 어떤 반응을 어떻게 강화할 것인가에 대한 계획이 강화계획이다. 강화계획은 크게 계속강화(continuous reinforcement)와 간헐적 혹은 부분강화(intermittent or partial reinforcement)로 구분된다. 계속강화는 발생한 모든 반응에 강화물을 재공하는 경우로 일반적으로 실제적인 생활상황에서 발견되는 경험이 아니다. 반면에, 간헐적 강화는 행동을 통제하기 위해 정해진 계획에 따라 강화물이 제공되는 것으로, 강화계획은 특별한 시간간격 혹은 특별한 반응비율에 근거할 수 있다. 간헐적 강화에는 시간과 비율을 바탕으로 효과적인 행동 통제를 위해 사용되는 네 가지 강화계획, 즉 고정간격계획(fixed-interval schedule), 변동간격계획(variable-interval schedule) 고정비율계획(fixed-ratio schedule), 변동비율계획(interval-ratio schedule)이 있다. 이러한 강화계획에 대해 간략하게 살펴보자.

- 고정간격계획 : 일정한 시간 간격마다 강화물이 주어지는 경우로, 피험자가 하는 반응의 수는 관계가 없다. 예를 들면, 노동자가 얼마나 많이 일했는가에 관계없이 주급이나 월급으로 봉급이 주어지는 경우이다.

- 변동간격계획 : 일정한 시간 간격 없이 우선적으로 강화물이 주어지는 것으로, 역시 피험자가 하는 반응의 비율과는 관계가 없이 변동된 시간에 따라 강화물이 제공된다. 예를 들면, 낚시꾼이 던진 낚시 밥을 고기가 변동된 시간 간격으로 간헐적으로 건드리는 경우이다.

- 고정비율계획 : 일정한 반응비율에 따라 강화물이 주어지는 것으로, 시간과는 관계없이 피험자가 하는 반응의 수에 근거한 강화계획이다. 예를 들면, 노동자가 만든 생산품의 개수에 따라 일정한 보수가 지불되는 경우이다.

- 변동비율계획 : 변동된 반응비율에 따라 강화물이 불규칙적으로 주어지지만, 평균적으로 일정한 횟수의 반응 뒤에 강화가 주어지는 강화계획이다. 예를 들면, 도박꾼이 카지노의 슬롯 머신에 동전을 넣는 경우로 언젠가는 대박이 터지겠지 하면서 그만 두지 못하고 계속해서 도박을 하는 경우이다. 스키너는 이 강화계획이 높고 안정적인 반응비율을 야기 하는데 효과적이라는 것을 발견했다.

현대 사업사회에서 많은 사람들이 생산성을 높이는데 관심이 많다. 이상의 강화계획을 반응율이 가장 높게 일어나는 것부터 순서대로 나열하면 변동비율계획, 고정비율계획, 변동간격계획, 고정간격계획, 계속강화계획이다.

◎ 변별과 일반화

조작적 조건형성에서 중요한 ‘세 가지 용어 수반성’에 따라, 행동에 선행되는 자극은 행동이 수행되면 강화가 일어날 것인가에 원인을 제공하기 때문에 매우 중요하다. 자신이 이전에 학습한 것을 바탕으로 사람들은 자극변별(stimulus discrimination)을 학습한다. 즉 우리는 어떤 상황(자극)에서 우리의 행동이 강화될 것 같은가 혹은 다른 상황(자극)에서 같은 행동이 강화되지 않을 것인가에 대한 변별을 학습한다. 또는 어떤 상황에서 우리의 행동이 처벌될 것 같은가 혹은 다른 상황에서 같은 행동이 처벌되지 않을 것인가에 대한 변별을 학습한다. 예를 들면, 교통신호등은 우리에게 변별된 자극으로 행동한다. 우리는 신호등의 불빛에 따라 어떻게 행동해야 하는가에 대한 변별을 학습하였다. 만약 개인이 적절한 자극변별을 하지 못한 경우에, 그는 교통신호(자극)을 위반하여(행동) 벌금을 물거나 사고(결과)를 내 어려움에 처할 것이다.

특별한 상황에서 반복적으로 강화된 반응은 그러한 상황에서 반복될 가능성이 높다. 그러나 상황들은 흔히 공통적 속성을 공유하는 복잡한 자극들의 집합으로 구성되어 있다. 스키너는 주어진 자극에서 발휘된 통제는 다른 유사한 자극들에서 공유된다는 것을 지적하였다(Skinner, 1953, p. 132). 어떤 상황(자극)에서 강화된 행동이 역시 유사한 다른 상황들(자극)에서 일어나는 것을 자극일반화(stimulus generalization)라고 한다.

일반화는 변별과 대립되는 개념이다. 즉 개인이 다른 두 상황을 변별할 때, 그것은 그의 반응이 한 상황과 다른 상황을 일반화하는 것을 실패했다는 것을 의미한다. 역시 그의 반응이 다른 두 상황에 일반화 됐을 때, 그것은 그가 두 상황을 변별하는 것을 실패했으며 두 상황에서 같은 반응을 한다는 것을 의미한다.

 

 

 

 

스키너의 조작적 조건형성.hwp

스키너의 조작적 조건형성.hwp
0.02MB