[밑시딥1] 퍼셉트론 이란? – 2장 퍼셉트론

퍼셉트론 이란? 퍼셉트론 개념

인공신경망의 가장 기본적인 형태 중 하나로 입력값에 가중치를 곱한 후, 모든 가중치의 합에 대해 활성화 함수를 적용하여 출력값을 결정하는 방식으로 작동합니다. 가장 간단한 형태의 선형 분류기입니다.

퍼셉트론의 기본 구성 요소는 다음과 같습니다:

  • 입력층(Input layer): 입력 벡터 (x)가 주어지며, 각 입력 값은 특정 가중치 (w)와 곱해집니다.
  • 가중치(Weights): 각 입력에 곱해지는 계수로, 퍼셉트론의 학습 과정에서 조정됩니다
  • 편향(Bias):입력신호가 각 노드에 전달될 때, 더해지는 수.

퍼셉트론의 한계

퍼셉트론의 가장 큰 한계는 선형적으로 구분 가능한 문제(linearly separable problems)만 해결할 수 있다는 점입니다. 즉, 데이터를 선형 경계로 나눌 수 있어야 합니다. 이러한 특성 때문에 퍼셉트론은 복잡한 문제를 해결하는 데에는 적합하지 않습니다. 가장 유명한 예로, XOR 문제가 있습니다.

XOR 문제와 퍼셉트론의 한계

XOR 문제는 간단한 논리 회로 문제로, 두 입력 값이 서로 다를 때만 참(1)을 출력하고, 그렇지 않으면 거짓(0)을 출력합니다. 이 문제는 선형 경계로 데이터를 분리할 수 없기 때문에, 단층 퍼셉트론으로는 해결할 수 없습니다.

퍼셉트론의 한계를 넘어

퍼셉트론의 이러한 한계를 극복하기 위해 여러 방안이 제시되었습니다. 가장 대표적인 해결책은 다층 퍼셉트론입니다. 다층 퍼셉트론은 여러 개의 층을 가지며, 각 층은 여러 개의 뉴런으로 구성됩니다. 이 구조는 비선형 문제를 해결할 수 있는 능력을 가집니다. 한마디로 Nand 게이트와 OR 게이트를 조합하면 비선형인 XOR게이트를 표현할 수 있게됩니다. 단층과 다층 layers를 쌓는다는게 무슨의미인지는 차차 이해해가도 될 것 같습니다.

결론

이러한 퍼셉트론은 인간이 파라미터를 직접 수정해야한다는 한계때문에 인공신경망이 나오게 되었고, 퍼셉트론의 선형성 문제를 해결하기 위해 다층퍼셉트론과 활성화함수라는 개념이 나오게 됩니다. 다음장에서 알아봅시다.

Leave a Comment