LLM의 주요 개념과 진화 과정 (1/3회)

정보통신

by ICT찐찐찐 2024. 6. 24. 01:00

금일은 인공지능 관련 LLM(대형 언어 모델, Large Language Model)에 대하여 살펴보겠습니다.

2022년 12월 OpenAI는 2년 전에 출시된 GPT-3 LLM(대형 언어 모델)의 개선된 버전인 ChatGPT 3.5를 조용히 출시했습니다. 반응은 폭발적이었고 AI 시장을 뒤흔들었습니다. Netflix가 이용자 100만을 달성하는데 3.5년이 걸린 반면, ChatGPT는 단 5일 만에 이 기록을 달성했습니다. 최근에는 AI를 이야기 할 때 LLM과 GPT가 가장 먼저 떠오르게 되었습니다. 이러한 LLM을 더 잘 이해하고 활용하기 위해 인공지능과 관련된 주요 개념과 현재 진행중인 LLM의 진화 과정을 살펴보겠습니다.

인공지능의 주요 개념과 분류

인공지능(AI, Artificial Intelligence)은 인간의 지적 능력을 컴퓨터를 통해 구현하는 기술입니다. AI는 인간이 수행하는 인지적 기능을 자동화하기 위해 다양한 알고리즘과 데이터 처리 기술을 활용합니다. 이를 통해 AI는 의료, 금융, 자율주행, 자연어 처리 등 다양한 분야에서 혁신적인 발전을 이끌어내고 있습니다. AI의 주요 하위 분야로는 머신러닝과 딥러닝, 자연어처리와 LLM이 있습니다.

머신러닝과 딥러닝
먼저 머신러닝(Machine Learning)은 데이터로부터 컴퓨터가 스스로 학습하여 규칙을 만들어내는 기술입니다. 이 기술은 인간의 명시적인 프로그래밍 없이도 컴퓨터가 패턴을 인식하고 예측을 수행할 수 있도록 합니다. 예를 들어, 스팸 메일을 분류하는 이메일 필터링 시스템은 많은 양의 이메일 데이터를 학습하여 스팸과 정상 메일을 구분하는 규칙을 학습합니다. 머신러닝 모델은 다양한 데이터셋에서 학습하며, 이를 통해 새로운 데이터에 대한 예측을 수행할 수 있게 됩니다.

딥러닝(Deep Learning)은 인간의 뇌의 뉴런을 본떠 만든 인공신경망(Artificial Neural Networks)을 기반으로 하는 모델입니다. 딥러닝은 머신러닝의 하위 분야로, 복잡한 데이터 패턴을 학습하고 이해하는 데 뛰어난 성능을 보입니다. 예를 들어, 딥러닝을 활용한 이미지 인식 기술은 수많은 이미지를 학습하여 고양이와 개를 구분하는 능력을 갖추게 됩니다. 특히 이미지 인식, 음성 인식, 자연어 처리(NLP) 등에서 우수한 성과를 내고 있습니다.

자연어처리와 LLM
자연어처리(NLP, Natural Language Processing)는 컴퓨터가 인간의 언어를 이해, 분석 및 생성할 수 있도록 해주는 인공지능 기술의 한 분야입니다. NLP의 발전은 텍스트 데이터를 활용한 다양한 응용 프로그램의 개발을 가능하게 했습니다. 예를 들어, 구글 번역과 같은 자동 번역 시스템이나, 시리(Siri)와 같은 음성 인식 비서가 있습니다.

LLM(Large Language Models)은 이러한 NLP 기술을 한 단계 더 발전시킨 것입니다. LLM은 문장과 문장이 어떻게 이어지는지를 잘 이해하고 조합하여 대규모 AI가 답을 제공할 수 있도록 하는 모델입니다. 쉽게 생각하면 Goolge과 같은 검색엔진에서 텍스트를 입력하면 뒤에 올 문장을 자동으로 만들어 주는 것과 유사합니다. 대표적인 예로 GPT(Generative Pre-trained Transformer) 모델이 있습니다. 이 모델은 사전 학습된 데이터를 바탕으로 새로운 텍스트를 생성하거나 질문에 대한 답변을 제공할 수 있습니다. 예를 들어, ChatGPT는 사용자와 대화를 나누며 정보를 제공하거나, 창의적인 글을 작성하는 데 사용될 수 있습니다.

인공지능 모델의 분류
LLM과 함께 많이 사용되는 용어 중 하나가 생성형 AI 입니다. 인공지능(AI) 모델은 크게 판별형 AI와 생성형 AI의 두 가지 범주로 분류할 수 있습니다. 분류(Classification) 및 회귀(Regression) 모델과 같은 판별 AI 모델은 인간이 정의한 기능을 기반으로 데이터를 사전 정의된 클래스로 분류하거나 예측하도록 설계되었습니다. 이러한 모델은 다양한 범주를 구별하고 입력 데이터를 기반으로 예측하는 데 탁월합니다. 반면, GAN(Generative Adversarial Networks) 및 GPT 모델과 같은 생성형 AI 모델은 실제 데이터 분포를 모방하는 새로운 데이터 샘플을 생성하도록 훈련되었습니다. 이러한 모델은 현실적이고 참신한 출력을 생성하는 데 능숙하므로 콘텐츠 제작 및 시뮬레이션 애플리케이션에 이상적입니다. 특정 작업에 적합한 접근 방식을 선택하려면 이러한 AI 모델 유형 간의 차이점을 이해하는 것이 중요합니다.

다음 연재에서는 LLM 진화에 대하여 살펴보겠습니다.

정보통신기술사 김석중

'정보통신' 카테고리의 다른 글

LLM의 주요 개념과 진화 과정 (3/3회) (0)	2024.06.26
LLM의 주요 개념과 진화 과정 (2/3회) (0)	2024.06.25
정보통신기술사 합격방법 천기누설 (0)	2024.06.21
5G 특화망과 서비스 모델 (0)	2024.06.20
방송 현장에서 AI 기술 활용 (KOBA 2024 conference 후기) (0)	2024.06.19