퍼셉트론 (Perceptron)
퍼셉트론(Perceptron)은 입력 값을 받아 가중치와 더해진 합을 계산하고, 활성화 함수를 통해 출력 여부를 결정하는 가장 기본적인 형태의 인공 뉴런 모델이다. 1957년 프랭크 로젠블랫(Frank Rosenblatt)이 제안한 개념으로, 현대 인공신경망(ANN)과 딥러닝 구조가 발전하는 데 이론적·구조적 기반을 제공한 최초의 신경망 모델로 평가된다.
Ⅰ. 개념과 역사
퍼셉트론은 1957년 로젠블랫이 제안한 이진 분류 모델로, 입력 데이터에 가중치를 곱한 뒤 이를 합산해 특정 임계값을 넘으면 1, 아니면 0을 출력하는 단순한 구조를 가진다. 초기에는 패턴 인식 문제를 다룰 수 있는 혁신적 모델로 평가되었지만, 단층 퍼셉트론은 XOR 문제를 해결할 수 없다는 한계가 발견되며 1970년대 ‘AI 겨울’을 촉발한 주요 원인 중 하나로 기록된다. 이후 역전파(backpropagation)가 도입되면서 다층 퍼셉트론(MLP)이 부활하여, 오늘날 딥러닝의 기반이 되었다.
Ⅱ. 작동 원리
퍼셉트론은 가장 기본적인 형태의 신경망 연산을 수행한다. 입력 → 가중합 → 활성화 함수 → 출력의 흐름을 가진다.
- ① 입력(Input) — 여러 입력 값 \(x_1, x_2, …, x_n\).
- ② 가중합(Weighted Sum) — 각 입력에 가중치 \(w_i\)를 곱해 합산:
z = Σ(wᵢxᵢ) + b - ③ 활성화 함수 — 단층 퍼셉트론에서는 주로 계단 함수(step function) 사용.
- ④ 출력(Output) — 임계값(Threshold)을 기준으로 0 또는 1 출력.
Ⅲ. 퍼셉트론의 구성 요소
- 입력(Input) — 모델이 받아들이는 특징(feature) 값.
- 가중치(Weight) — 입력의 중요도를 조절하는 핵심 변수.
- 편향(Bias) — 활성화 기준점을 조정하는 값.
- 활성화 함수 — 출력 결정을 위한 함수.
- 출력(Output) — 0 또는 1 형태의 결과.
Ⅳ. 단층 퍼셉트론 vs 다층 퍼셉트론
- 단층 퍼셉트론 (Single-layer Perceptron) — XOR과 같은 비선형 문제를 해결할 수 없음.
- 다층 퍼셉트론 (MLP) — 은닉층 추가 + 역전파 알고리즘 도입으로 비선형 문제 해결 가능. 현대 딥러닝의 출발점이 되는 구조.
Ⅴ. 퍼셉트론의 응용 분야
단층 퍼셉트론은 매우 단순하지만, 신경망의 핵심 개념을 설명하는 데 중요한 역할을 한다. 다층 구조로 확장될 경우 다음과 같은 분야에서 활용된다.
- 이미지 분류(MLP 기반 초기 모델)
- 텍스트 분류(스팸 탐지, 감정 분석 등)
- 신호 처리 및 패턴 인식
- 딥러닝 모델의 기본 블록 구성
Ⅵ. 기술적 의의와 한계
퍼셉트론은 ‘기계가 학습할 수 있다’는 개념을 최초로 제시한 역사적·기술적 출발점이다. 하지만 단층 구조로는 비선형 문제(XOR 등)를 해결할 수 없다는 근본적 한계가 존재하며, 이를 통해 다층 신경망 연구가 촉발되었다. 오늘날 딥러닝에서 사용되는 신경망 구조는 모두 퍼셉트론 개념의 확장이라 할 수 있다.
Ⅶ. 요약
퍼셉트론은 데이터를 입력받아 가중치 연산을 수행한 뒤 활성화 함수를 통해 출력을 결정하는 가장 기초적인 형태의 인공 뉴런 모델이다. 단층 퍼셉트론만으로는 복잡한 문제를 해결하는 데 한계가 있지만, 이후 MLP·딥러닝·생성형 AI 등 현대 인공신경망 아키텍처가 발전하는 데 핵심적 개념적 기반을 제공한, 인공지능 역사에서 매우 중요한 출발점이다.