AI(인공지능), 특히 Generative AI는 무엇인가: ChatGPT와 DALL-E

AI, 즉 인공지능은 세간의 관심을 한 몸에 받고 있는 분야가 되었다. 알파고의 등장은 센세이션 그 자체였다. 그리고 현재 ChatGPT의 출현으로 실제 인공지능을 경험해 볼 수 있게 됨에 따라 그 파급력은 헤아리기 힘들 정도가 되었다. 활용분야도 무궁무진하다. 그것은 ChatGPT가 생성형 인공지능(Generative AI)이기 때문이다. 이제 Generative AI는 상식의 영역으로 들어왔다. 마침 기초를 소개하는 맥킨지의 기사가 있어 재구성해 소개해 보려 한다.

Generative AI(생성형 인공지능)는 음성, 코드, 이미지, 텍스트, 시뮬레이션, 영상 등을 포함한 새로운 컨텐츠를 생성하는 데 사용되는 알고리즘을 가리킨다. 대표적인 예가 ChatGPT다. 이 분야에서 최근의 큰 진전은 콘텐츠 생산 방식을 급격하게 변화시킬 수 있는 잠재력을 보여주고 있다. 경험해 본 사람이라면 아마도 어마어마한 컨텐츠 생산능력을 확인했을 것이다.

Generative AI에 대해서 살펴보기 전에 머신러닝 개념을 먼저 알아볼 필요가 있다. 일반적인 인공지능의 개념과 머신러닝에 대해 함께 소개하려 한다. 두 개념은 짝을 이뤄 많이 등장하니 비교해서 알아보면 좋을 것이다.

머신러닝과 인공지능의 차이는 무엇인가

인공지능은 이름 그대로 인간의 지능을 모방하여 작업을 수행하도록 하는 기술이다. 아마도 많은 사람들이 인공지능과 상호작용한 경험이 있을 것이다. Siri나 Alexa와 같은 음성 비서, 고객서비스 센터 챗봇 같은 것들이 인공지능 기반 기술들이다.

머신러닝은 인공지능의 한 유형이다. 머신러닝은 사람의 별도 조작 없이 데이터 패턴에서 학습할 수 있도록 개발된다. 현재 생성되고 있는 거대한 데이터의 양과 복잡성은 머신러닝의 잠재력을 증가시키고 필요성도 증대시켜 왔다.

다시 한번 정리해 보면, 인공지능은 사고, 학습, 추론, 문제해결 등 다양한 인간의 지능적 특성을 모사하는 시스템을 말하며, 머신러닝은 인공지능의 한 분야로 데이터를 기반으로 컴퓨터 시스템이 자동으로 학습하고 결정을 내릴 수 있도록 하는 알고리즘 기술을 의미한다.

Genrative AI는 머신러닝 기술에 기반한 알고리즘이라고 할 수 있다. 머신러닝에 대해 조금 더 살펴보자.

머신러닝 모델의 발전 경로

1930년대와 1940년대 앨런 튜링을 비롯한 컴퓨팅 선구자들이 머신러닝을 위한 기본 기술을 연구하기 시작했다. 머신러닝은 작은 데이터셋을 위해 개발된 고전적인 통계기법을 기반으로 한다. 초기 컴퓨터는 엄청난 크기로 인해 쉽게 접근할 수 없는 것이었고 연구를 뒷받침할 만큼 성능도 강력하지 못했다. 그러다 1970년대 후반 이러한 기술을 구현할 수 있는 강력한 컴퓨터를 개발할 수 있게 되면서 연구가 본격화 되었다.

최근까지 머신러닝은 대부분 예측모델에 국한되어 있었다. 콘텐츠 패턴을 관찰하고 분류하는데 주로 사용되었다. 예를 들어 이미지 사이의 패턴을 식별한 후 일치하는 이미지를 분류하는 것이다. 이후 Generative AI는 큰 돌파구였다. 이제 사진을 인식하고 분류하는 것에서 나아가 필요에 따라 이미지나 설명 텍스트를 생성할 수 있게 된 것이다.

텍스트 기반 머신러닝은 최근의 AI를 이해하는데 필수다. ChatGPT는 텍스트로 요구사항을 입력하는 체계다. 음성명령도 결국은 텍스트다. 입력하는 대화문인 Prompt에 대해 답변인 Response를 생성하는 방식이다.

텍스트 기반 머신러닝은 무엇인가

텍스트로 작동하는 첫 번째 머신러닝 모델은 연구자가 미리 설정한 라벨로 다양한 입력을 분류하는 것이었다. 예를 들어 소셜미디어 게시물을 긍정적이거나 부정적인 것으로 라벨링 하는 훈련을 시킬 수 있다. 이러한 유형의 훈련은 감독학습(Supervised Learning)이라고 알려져 있다.

다음 세대의 텍스트 기반 머신러닝 모델은 자기지도 학습(Self-Supervised Learning)에 의존한다. 이러한 유형의 훈련은 모델에 대량의 텍스트를 제공하여 예측 생성능력을 갖게 하는 것이다. 예를 들어 몇 개의 단어를 기반으로 문장이 어떻게 끝날지 예측하게 할 수 있다. 충분한 양의 샘플 텍스트, 즉 인터넷의 광범위한 내용을 이용하면 이러한 텍스트 모델은 매우 정교해진다. ChatGPT와 같은 도구의 성공을 통해 우리는 이러한 정교함과 정확도를 목격하고 있다.

현재 Generative AI의 대표 격으로 언급되고 있는 것은 역시 OpenAI사에서 개발한 ChatGPT일 것이다. 여기에 더해 같은 회사에서 개발한 이미지를 생성하는 AI인 DALL-E도 많은 주목을 받고 있다.

Generatve AI의 대표주자 ChatGPT와 DALL-E

ChatGPT는 근래에 많은 관심을 받고 있다. GPT는 Generative Pretrained Transformer의 약자로 거의 모든 질문에 답변을 생성할 수 있는 일종의 챗봇이다. OpenAI에서 개발되었으며, 2022년 11월에 베타버전으로 공개되었다. 현재 최고의 인공지능 챗봇으로 평가받고 있으며 인기 또한 높다. 공개 단 5일 만에 백만 명 이상이 가입하는 성과를 올렸고 두 달 만에 2억 명을 돌파했다고 한다. 최근에는 최신언어 모델인 GPT-4까지 출시되었다. 많은 사람들이 직접 이용해보고 난 후 컴퓨터 코딩, 대학 수준의 에세이, 시, 그리고 심지어 꽤 괜찮은 농담을 생성하여 게시하기도 했다. 한편으로는 콘텐츠 창작으로 생계를 유지하는 사람들에게 위협이 되지 않을까 하는 걱정도 생겨나기 시작했다.

ChatGPT와 다른 인공지능, 그리고 머신러닝 전반에 대해 많은 사람들이 우려를 표명했지만 머신러닝은 분명히 사람들에게 이익이 되는 잠재력을 가지고 있다. 머신러닝은 의료영상 분석이나 일기예보 같은 다양한 산업에서 영향력을 입증해 왔다. 인공지능의 도입은 매해 폭발적으로 늘고 있으며 인공지능에 대한 투자 역시 빠르게 증가하고 있다. ChatGPT나 DALL-E(인공지능 기반 그림 그리기 도구)와 같은 생성형 인공지능 도구들은 다양한 작업의 수행 방식에 변화를 일으킬 것임은 분명하다. 그러나 그 영향의 범위와 그에 따른 위험은 아직 정확하게 평가할 수 없는 단계다.

그러나 현 단계에서 몇 가지 의문에 대해서는 답할 수 있을 것이다. 예를 들어 생성형 인공지능 모델이 어떻게 구축되는지, 어떤 종류의 문제를 가장 잘 해결할 수 있는지 등이다.

Generative AI 모델 무엇을 할 수 있나

지금까지 생성형 AI 모델을 구축하는 것은 주로 대규모 프로젝트였다. ChatGPT와 DALL-E를 개발한 OpenAI는 유명한 기업으로부터 수십억 달러의 자금을 지원받았다. DeepMind는 Google의 계열사이다. 이러한 기업들은 세계 최고의 컴퓨터 과학자와 엔지니어들을 고용하고 있다.

ChatGPT는 'A-' 수준의 대학 과제물을 10초 만에 작성할 수 있다는 말도 있다. 또한 특정 신문사 특유의 문체로 글을 써달라고 할 수도 있다. DLL-E는 화가 살바도르 달리와 애니메이션 영화 WALL-E를 결합한 이름이다. 라파엘이 그린 성모마리아와 같은 이미지부터 장난 같은 요상한 이미지까지 생성해 낼 수 있다는 의미로 이름을 지은 것 같다.

그러나 결과물이 항상 정확하거나 적절하지는 않다. 완전히 엉뚱한 그림을 그려내거나 텍스트 출력물의 경우 그럴듯하게 거짓정보를 주기도 한다. 생성형 AI의 출력물은 알고리즘을 훈련시키는 데 사용된 데이터에 의해 좌우되므로 기반 데이터의 양이 방대하면 출력물이 창의적으로 보일 수도 있다. 더군다나 일반적으로 무작위 요소를 포함하고 있기 때문에 동일한 요청에도 다양한 출력물을 생성할 수 있다.

아마도 ChatGPT와 같은 도구를 통해 신기한 경험을 했을 것이다. 기업들에게도 분명한 기회가 있다. 생성형 AI는 몇 초안에 다양한 신뢰성 있는 글을 생성하고 해당 글을 목적에 맞게 수정할 수도 있다. 이는 IT 및 소프트웨어 기업부터 마케팅 문구를 필요로 하는 기관까지 다양한 산업에 영향을 미친다. AI도구를 잘 활용하면 시간과 자원을 절약하고, 새로운 비즈니스 기회를 탐색하고 가치를 창출할 수 있다. 기회는 열려있다.

AI의 한계는 무엇이고, 이를 극복할 수 있는 방법은 무엇인가

새로 출시된 Generative AI 모델들은 아직 장기적인 영향을 확인하기에는 이르다. 따라서 이들을 사용하는 데 알려져 있는 위험요소와 잠재적 요소들을 살펴봐야 한다.

Generative AI의 출력물은 매우 설득력 있게 보일 수 있다. 이는 의도된 결과다. 하지만 때로는 생성된 정보가 사실이 아닐 수도 있다. 더 나쁜 경우는 편향된 시각을 제공할 수 있다는 것이다. 인터넷에 편향된 정보들이 넘치기 때문일 것이다. 불법행위에 도움을 줄 수도 있다. 예를 들어 ChatGPT는 차를 훔치는 방법에 대한 안내를 제공하지는 않지만 아기를 구하기 위해 차를 훔쳐야 한다고 말하면 알고리즘은 기꺼이 요구를 수용한다. 생성형 AI를 이용하는 조직은 향후 저작권 침해에 직면할 수도 있다. 여러 예상되는 위험을 신중히 고려해 봐야 한다.

그러나 이러한 위험은 몇 가지 방법으로 완화될 수 있다. 첫째, 훈련에 사용되는 초기 데이터를 신중하게 선택하여 위해한 정보를 포함하지 않도록 하는 것이다. 또한 범용적인 모델을 사용하는 대신 특정범위를 커버하는 특화된 모델을 사용할 수도 있을 것이다. 자원이 충분한 회사는 자체 데이터를 기반으로 맞춤화하여 위험을 최소화할 수도 있다. 또한 결과물을 실제 이용하기 이전에 인간이 최종 확인하는 체계도 고려할 수 있다.

강조할 만한 것은 이것이 완전히 새로운 분야라는 것이다. 위험과 기회 모두 몇 주, 몇 달, 몇 년 안에 빠르게 변화할 것이다. 새로운 사용 사례가 축적될 것이고 새로운 모델이 계속 개발될 것이다. 그리고 생성형 AI가 점차 비즈니스, 사회, 개인의 삶에 자연스럽게 통합됨에 따라 새로운 규제적 환경이 형성될 것으로 예상된다. AI 모델을 계속 실험해 보고 가치를 창출하는 동시에 경영자들은 위험요소와 규제상황을 지속적으로 파악해 나가야 할 것이다.

[Reference: MaKinsey & Company, What in Generative AI?, January 19, 2023]

저작자표시 비영리 변경금지

지식부티크-불꽃유랑단