챗 GPT에서 'P'의 의미인 Pre-trained 단어의 뜻을 찾아보는 분들이 많아졌습니다. 이번 포스팅에서 사전적 의미와 GPT 인공지능에 적용된 의미에 대해 이해하기 쉽게 정리했습니다. 자세한 의미를 지금 바로 확인해 보세요.
1. Pre-Trained 사전적 뜻
Pre-Trained 단어의 사전적 의미는 특정 작업(질문, 답변, 요약, 번역 등)이나 상황에 적용되기 전에 특정 기술이나 지식이 사전에 훈련(학습)된 모델을 의미합니다. 특정 작업을 수행하기 전에 대규모 언어, 이미지 등의 데이터를 기계 학습 모델에 교육하여 특정한 작업을 수행하는 것입니다. 학습한 데이터의 양이 많을수록 생성하는 결과물의 정확성과 정밀도는 높아집니다.
사람의 질문에 대한 답변을 제공하는 챗봇을 예로 들 수 있죠. 은행에서 운영하는 상담 챗봇은 금융 용어와 은행 업무에 사용하는 단어들을 학습하였습니다. 학습한 데이터를 바탕으로 고객이 은행 업무에 대한 질문을 하면 은행 업무를 해결할 수 있는 답변을 주는 것입니다.
Pre-Trained가 적용된 대표적인 사례가 Open AI에서 개발한 Chat GPT 챗봇입니다. 대규모의 언어 데이터를 학습해서 사람 사람이 사용하는 언어와 가장 유사한 답변을 내놓는 인공지능이죠. Chat GPT는 사람이 입력한 질문에 대해 답변, 요약, 번역 등의 결과물을 내놓습니다. 이제 챗 GPT에 적용된 Pre-trained의 의미에 대해 아래에서 더 자세하게 알아보겠습니다.
2. 챗 GPT에 적용된 Pre-Trained 의미
챗 GPT에서 GPT는 Generative Pre-trained Transformer의 약어입니다. GPT에서 Pre-trained는 GPT에서의 데이터 사전 학습 과정을 의미합니다. 최근 세계적으로 이슈를 불러일으킨 챗 GPT는 대규모의 '자연어'를 학습했습니다. 여기서 자연어란 사람이 일상적으로 사용하는 언어를 의미합니다.
책, 웹 페이지, 기사 등을 통해 엄청난 양의 자연어를 학습하였습니다. 그리고 주변 단어의 문맥을 고려하여 정확도가 높은 특정 단어를 생성합니다. 이 과정은 사람이 일상적으로 사용하는 단어를 높은 확률로 예측하고 선택하는 과정인데요. 이 과정으로 인해 Chat GPT는 사람이 쉽게 이해할 수 있는 답변을 제시합니다. 아직 답변의 정확도가 낮음에도 불구하고 전 세계의 사람들이 놀라게 된 이유가 바로 인공지능이 제시한 답변이 사람이 쉽게 이해할 수 있었기 때문입니다.
3. Pre-Trained의 GPT 적용
대중에게 첫 공개된 GPT-3.5 버전은 언어적 질문에 대한 답변만 생성할 수 있었습니다. 최근에 출시된 GPT-4 버전은 언어뿐만 아니라 이미지, 영상까지 인식합니다. 이미지에 대한 질문을 하면 이미지를 이해하여 그에 대한 답을 내놓습니다.
이미지 정보 이해 예시
기존의 컴퓨터는 이미지가 가지고 있는 의미를 이해할 수 없었습니다. 사진 파일은 '사진 파일' 그 자체로만 이해할 수 있었으며 사진에 담긴 의미는 해석할 수 없었죠. GPT 인공지능은 이미지의 의미를 세부적으로 해석해서 사람에게 설명할 수 있는 능력을 갖추고 있습니다.
차트 추론 예시
GPT-4는 이미지에 포함되어 있는 텍스트 정보를 이해하고 추론할 수도 있습니다. 위의 사진에 포함되어 있는 Finland, Georgia, Western Asia의 육류 소비량 정보를 해석해서 단계적인 추론과 답변을 제시합니다.
댓글