Neuro-Tech

[딥러닝101] 딥러닝 구조와 학습 원리 1편: 딥러닝의 시작, 인공신경망

들어가며

지금까지 우리는 딥러닝 학습에 필요한 이미지 데이터와 AI 기능을 살펴보았습니다. 특히 딥러닝 모델의 성능을 높이려면 균형 잡힌 데이터와 정확한 레이블링이 필수적임을 확인할 수 있었습니다.

많은 매체가 인공지능을 인간과 유사한 자아를 지닌 존재로 묘사하지만, 실제 인공지능은 특정 작업에 특화된 도구에 가깝습니다. 이번 글에서는 딥러닝의 시작점인 인공신경망의 등장과, 이후 기술 발전을 이끈 주요 사건들을 함께 살펴보도록 하겠습니다.


딥러닝 역사 속으로: 인공신경망의 등장

인공신경망은 딥러닝 발전의 근간이자, 현재 AI 시대를 이끄는 주역이라 할 수 있습니다. 인공 신경망의 등장 이후 인공지능과 딥러닝 발전에 영향을 미친 네 가지 주요 사건은 아래와 같습니다.

퍼셉트론의 탄생

인공신경망은 사람의 뇌를 본떠 만들어졌습니다. 초기 인공신경망인 퍼셉트론은 뇌 속 뉴런과 시냅스의 연결 방식을 모방한 구조입니다. 시냅스는 경험과 학습을 통해 변하는데, 이를 ‘가소성’이라 부릅니다. 퍼셉트론은 이런 특성을 반영해 입력 신호에 가중치를 조절하며 출력을 생성하도록 설계되었습니다.


인공신경망을 깨운 역전파 알고리즘

퍼셉트론은 단순한 구조로 복잡한 문제 해결에 한계가 있어 한동안 주목받지 못했습니다. 그러나 1986년 데이비드 러머하트가 역전파(backpropagation) 알고리즘을 발표하며 인공신경망 연구가 다시 활기를 띠었습니다.

역전파 알고리즘모델의 예측값과 실제 정답 간 차이를 계산해 가중치를 조정하는 방법으로, 골프에서 빗나간 공의 위치를 보고 다음 샷을 조절하는 것과 같습니다. 이처럼 반복적인 조정을 통해 인공신경망은 점점 더 정확한 출력을 만들어냅니다.


CNN의 출현

1998년 얀 러쿤이 발표한 CNN(Convolutional Neural Network)은 이미지 처리에 특화된 딥러닝 구조로, 다양한 비전 문제의 해결에 사용되고 있습니다. 여기서 합성곱(Convolution)은 이미지의 일부분을 필터로 스캔하며 특징을 추출하는 방식으로, 마치 돋보기를 들고 관찰하는 것과 비슷합니다. 이를 통해 CNN은 이미지 속 유용한 패턴을 효과적으로 인식할 수 있습니다.


알파고의 등장

알파고는 딥러닝과 강화학습을 바탕으로 바둑 챔피언 이세돌과의 대결에서 승리하며, 인공지능의 잠재력을 전 세계에 각인시켰습니다. 많은 이들이 인간이 우위에 있다고 믿었던 바둑에서 AI가 승리한 것은 기존 인식을 뒤흔드는 사건이었습니다. 이세돌은 다섯 개중 한 대국을 이겨 “AI를 이긴 유일한 인간”으로 불리게 되었습니다.

이 대결은 인공지능이 인간의 지적 영역에 본격적으로 들어섰음을 알리는 상징적 계기가 되었고, 이후 알파고는 알파제로 등으로 발전했습니다. 개발사 딥마인드는 단백질 구조 예측 AI인 알파폴드(AlphaFold)를 선보이며 생명과학 분야에서도 큰 혁신을 이루었고, 이 업적은 노벨상으로 이어졌습니다.

출처: 연합뉴스

오늘날 우리는 다양한 대규모 언어모델(LLM, Large Language Model)이 일상에 깊이 스며든 시대에 살고 있습니다. 많은 사람들이 인공지능을 업무와 생활 속 도구로 활용하며, 다양한 직업군이 직간접적으로 그 영향을 받고 있죠.

하지만 여전히 인공지능은 메타인지 능력에 한계를 지니고 있으며, 특히 환각(hallucination) 문제는 해결되지 않은 주요 과제로 남아 있습니다. 인간은 아주 짧은 시간에 자신이 아는 것과 모르는 것을 구분할 수 있지만, 인공지능은 막대한 컴퓨팅 자원을 사용하고도 종종 전혀 엉뚱한 답변을 내놓습니다. 최근에는 인공지능이 기술적 한계에 다다른 것이 아니냐는 우려도 제기되고 있습니다.


마치며

오늘은 딥러닝의 시작점이라 할 수 있는 인공신경망의 등장과, 이후 발전을 이끈 주요 사건들을 함께 살펴보았습니다. 복잡해 보이는 인공지능 기술도 이러한 역사적 맥락을 이해하면 훨씬 친숙하게 느껴질 수 있죠. 이번 글이 딥러닝의 흐름을 이해하는 데 도움이 되었기를 바랍니다.

다음 편에서는 이를 바탕으로 딥러닝 모델의 개념과 구조, 그리고 다양한 모델 종류에 대해 알아보도록 하겠습니다.