안녕하세요? 그동안에는 ChatGPT의 가장 기본적으로 알아아야 할 내용을 살표보았습니다.
오늘부터는 ChatGPT4에 대하여 알아보고자 합니다. 그동안 ChatGPT 3.5기반으로 만들어진
대화형 인공지능 ChatGPT였다면 최근 출시된 ChatGPT4는 3.5에 비하여 뭐가 어떻게 달라
졌는지 살펴보고자 합니다.
1. Chat GPT4 출시!
GPT-4가 2023. 3. 14일부로 출시되었습니다. 2023년 3월 9일 "AI in Focus - Digital Kickoff"
이라는 이벤트에서 마이크로소프트 독일의 네 명의 직원들이 GPT 시리즈와 같은 대형 언어 모델
(Large Language Models, LLM)을 회사들에 대한 혁신적인 힘으로 소개하면서 Azure-OpenAI 에 대해
소개를 했다고 합니다. 마이크로소프트 독일 CTO이자 Lead Data & AI STU인 안드레아스 브라운은
대화 중 간단하게 GPT-4의 출시가 임박했다고 언급했다고 하는데, 그로부터 일주일 후 Chat GPT4가
출시되었습니다.
2. GPT4란 무엇일까?
그럼 GPT4가 도대체 어떤것일까요? GPT4는 Microsoft가 OpenAI와 협력하여 개발한 대규모
언어 모델입니다. GPT 시리즈의 4번째 작품으로 출시되었습니다. 이 모델은 자연어를 이해하고
텍스트를 이해하도록 설계되어 모든 언어로 질문에 답할 수 있습니다. 쉽게 예기 하면 현재 사용
하고 있는 ChatGPT의 진화된 버전이 나왔다라고 생각하시면 될거 같습니다.
2. GPT4 무엇이 다른가 ?
GPT4는 얼마전 GTP4가 나오면 인간인지 AI 인지 구분하기 힘들것이다 라는 전망이 나올 정도로
큰 성능 향상이 기대가 되고 있는 상황입니다. GPT4가 이미 컴퓨터가 얼마나 자연스럽게 인간과
소통할 수 있는지를 알아보는 튜링테스트를 통과했다는 이야기도 나오고 있을 정도로 업계의
기대가 큰거 같습니다.
◆ 멀티모달(Multimodal) 모델
멀티모달(Multimodal) 모델 GPT-4의 이전 버전 대비 가장 큰 개선점은 AI 측면에서 멀티모달
(Multimodal) 모델은 은 사람과 기계가 정보나 의미를 전달하기 위해 음성, 텍스트, 비디오,
이미지와 같은 다양한 형태로 대화하는 환경을 만들어가는데 있어 기존의 GPT 버전은
텍스트만 입출력이 가능한 반면에, GPT-4는 텍스트와 이미지를 사용자로부터 입력 받은 후
텍스트로 출력할 수 있는 멀티모달 모델을 사용하고 있다는 점이다.
예) 아래의 사진과 같이 이미지 사진을 제공하며 GPT4에 제공하면 GPT4는 사진의 이미지를
인식하고 이 사진에 나와 있는 재료들이 무엇인지를 읽을 수 있다는 것이다.
예전의 GPT3.5는 텍스트만 익식할수 있었으나 GPT4는 이미지를 인식하는 기능을
탑재되었다는 뜻이며 아래의 식재료로 어떤것을 만들수 있느냐는 질문에 레시피를
제공 해준다는 것이다.
◆ 메모리 성능
OpenAI에 따르면 GPT-4는 최대 32,768개 맥락 토큰 (단어, 형태소 등으로 나눈 자연어 단위)을
받을 수 있으며, 해당량은 약 64,000개 단어, 그리고 50페이지 정도의 분량을 기억 할수 있습
니다. 이는 이전 모델보다 더 많은 분량의 사용자와 나눈 대화를 기억할 수 있다는 의미이며,
맥락을 잘 파악하는 언어 능력과 연결되어 있어 인간과 소통하는데 더욱 원활히 할수
있도록 개선되었습니다 .
◆ 창의성, 독창성의 언어능력
GPT-4의 처리 가능 영어 단어는 25,000개로 기존의 Chat GPT(챗 GPT) 3,000개 보다 약 8배
이상 증가 하였으며. GPT-3.5는 미국 변호사 시험에서 하위 10%에 해당하는 성적을 기록한
반면, GPT-4는 상위 10%의 성적을 기록될 만큼 성능이 우수합니다.
또한, GPT-4는 독창성이 강화 되어 노래 작곡, 시나리오 작성, 사용자의 글쓰기 스타일의
학습이 가능 하는 등 다양한 분야에서 급속도록 발전하는 모습을 보이고 있습니다.
◆ 문제 해결능력
GPT-4는 GPT-3.5의 기능을 넘어 복잡한 수학적, 과학적 문제를 해결할 수 있는 강력한 능력을
보여주었습니다.
예) GPT-4는 이전 모델보다 더 효과적으로 어려운 미적분 문제를 해결하거나 화학 반응을 시뮬
레이션 할 수 있으며, 복잡한 방정식을 푸는 능력과 미적분, 대수학,기하학과 같은 다양한
수학적 연산을 수행할 수 있으며, 게다가 물리학, 화학, 생물학, 그리고 천문학과 같은 과학
과목들도 다룰 수 있습니다.
실제로 올림피아드의 경우, ChatGPT는 31%에 랭크되었지만 GPT-4는 99%로 상위 1%에
랭크되었으며, 변호사 자격 시험에서는 Chat GPT는 하위 10%에 랭크 되었으나, GPT-4는
상위10%에 랭크되었으며, 기술이 계속 발전함에 따라 GPT-4는 문제 해결력을
강화하고 더 넓은 범위의 주제와 작업에 훨씬 더 능숙 해질 것으로 예측됩니다.
◆ 환각 현상 개선
환각 현상이란 틀린 답도 맞는 것처럼 대답하는 것을 의미하는데, GPT4에서는 환각상태가
근절되지 않았지만, 어느정도 개선되었고, 대규모 훈련 데이터 세트,인간 피드백형 강화학습
(RLHF), 그리고 미세조정을 통해 지속해서 개선될 것으로 보입니다,
◆ 안정성
도메인별 50명의 전문가 피드백을 바탕으로 진행한 인간 피드백형 강화학습 (RLHF), 보상
모델 (RBRMs)을 활용하여 안전성을 제고 시켰습니다.
GPT-4는 GPT-3.5보다 허용되지 않는 질문에 대한 요청에 응답할 가능성이 82% 낮아진
대신 민감하지만 답변할 수 있는 질문에 대한 응답 가능성은 29% 증가하였고 ,
또한 사실에 입각한 응답을 할 가능성이 40% 더 높아졌다” 발표되었습니다.
◆ 사용언어 추가
기존의 챗GPT는 영어를 기반으로 구축되었기 때문에 한국어나 기타 외국어로 질의 하였을
때 완벽하고 정확도가 그리 높지 않았으나, 하지만, Chat GPT4 버전은 한국어와
이탈리아 등 26개국 언어를 추가함으로써 더욱 완벽하고 정확도 높은 대답을 인공지능이
할 수 있게 되었음
◆ 조향성
OpenAI는 GPT-4는 ‘성격’을 가지고 있다 밝혔음. 조향성(Steerability, 통제 가능 정도)은
필요에 따라 행동을 바꿀 수 있는 능력을 가리키는 개념으로 이전엔 고정된 어조나 스타일
을 가진 GPT-3.5였지만 GPT-4는 사용자의 필요에 따라 변경 가능함.
예) 사용자가 GPT-4에게 해적의 어조로 말해달라 요청한 사진으로 AI의 요구를 반영하며
해적의 말투로 재치있게 답변함.
◆ GPT-4의 매개변수 증가
GPT-4의 매개변수는 공개되지 않았으나 텍스트 800억~1400억 개, 이미지 200억 개, 토큰
수 역시 1조7000억~2조9000억개의 단어 조각으로 추정. 이를 통해 기존보다 장문의
문서를 생성 가능 해졌음.
※ 결론적으로 GPT-4의 놀라운 성능에도 불구하고, GPT-4는 이전 GPT모델과 비슷한 한계를
지니고 있음. 앞서 언급한 바와 같이 GPT-4는 사실에 대한 환각(Hallucination)을 일으키고
추론에서 오류를 범하기에 아직까진 GPT를 완전히 신뢰할 수 없는 단계임.
하지만 인간 피드백형 강화학습(RLHF), 보상 모델(RBRMs)을 통해 환각 현상을 지속적으로
줄이는 동시 출력하는 모달(데이터 형태) 또한 확장한다면 다양한 분야에 큰 영향을 끼치는
도구로 자리 잡을 것으로 기대됩니다.
4. GPT4의 우려 사항
GPT4의 우려 사항 중 하나는 신뢰성과 응답 검증의 어려움입니다. 기술이 발전하여 모든 언어의
자연어를 이해할 수 있지만 여전히 항상 정확한 응답을 제공할 수는 없습니다. Microsoft
는 현재 이 문제를 해결하기 위해 신뢰 메트릭을 만들고 있다고 합니다.
5. 미래 전망
GPT4로 인한 미래 전망은 콜 센터, 문서 처리, 반자동화와 같은 다양한 산업에서 효율성과 생산성
을 높일 수 있기 때문에 업계의 큰 변화를 줄수 있습니다. 참고로 GPT4와 같은 생성형
AI는 일자리를 대체하기 위한 것이 아니라 개인이 반복적인 작업을 보다 효율적으로 수행
할 수 있도록 돕기 위한 것입니다. 회사는 내부 역량 센터를 구성하여 직원에게 AI 사용을
교육하고 실무에 적용 하여 생산성을 높이고 경쟁력을 높이는 기회로 활용 할수 있습니다. GPT4
및 유사 기술의 지속적인 개발로 흥미로운 새로운 직업과 새로운 사업 기회들이 등장 할
것을 기대할 수 있습니다. 하지만 이에 따른 AI기술 발전으로 인한 부정적인 면도 분명 존재 할 수
밖에 없어 부작용들을 어떻게 대처하고 대응할지도 중요 하다고 생각해봅니다.
마지막으로 저의 생각을 정리 하자면 생성AI와 ChatGPT의 등장은 10년전 아이폰이 등장 했을때
보다 더 큰 변화와 새로운 가치 창출의 가능성을 만들어주는 기회라고 생각합니다.
앞으로는 AI를 적극 활용하여 새로운 가치를 만들어낸 개인과 기업들과 아닌 사람들의
차이가 더 커질거라고 생각이 듭니다.
IT분야에서 개발자로, 창업가로서 항상 새로운 기술에 따라가지 못하면 지금까지 배워왔던 경험과
지식이 쓸모 없어지는 경험을 많이 했는데 이제는 새로운것에 적응해 나가야 하는 경험과 도전이
IT뿐만 아니라 더 많은 분야에서 적응해야 하는 과제가 되지 않을까 생각해봅니다.
공감과 댓글은 큰 힘이 됩니다.
감사합니다.