‘생성형 AI’ 에 대해 좀 쉽게 알고 싶으신가요? 최근 마이크로소프트에서 100억달러라는 자금을 OpenAI에 투자하면서 관심을 가지는 분들이 많아진 것 같은데요. 여러분이 궁금해하시는 생성형 AI의 주요사건부터 핵심이 되는 GAN과 딥러닝의 원리까지 쉽게 알려드리도록 하겠습니다.
목차
생성형 AI 주요 사건 2가지
생성형 AI의 발전은 인공지능의 역사와 더불어 진행되어왔으나, 실질적인 영향을 끼친 주요 사건은 두 가지로 꼽힙니다.
1. Generative Adversarial Network (GAN)의 개발
GAN은 생성형 AI에서 가장 기본적이면서도 혁신적인 기술로, 실제 원본과 유사한 가짜를 만들어내는 능력을 갖추고 있습니다.
이해가 잘 안가시는 분들은 딥페이크를 떠올려보시면 좀 더 쉽게 이해할 수 있으실 겁니다.
이는 생성형 AI를 대표하는 핵심 기술 중 하나로 자리매김하고 있는데요.
GAN은 생성자(Generator)와 평가자(Discriminator)라는 두 신경망이 서로 경쟁하면서 학습하는 구조를 가지고 있습니다.
생성자는 더 진짜 같은 가짜를 만들어내려고 노력을 하고, 평가자는 이를 진짜와 비교하여 구별하는 역할을 수행합니다.
흔히 범인과 경찰에 비유를 많이 하는데요.
위조지폐를 생산하는 범인이 있다고 해보겠습니다.
이 범인은 위조지폐를 생산하지만, 경찰은 진짜 지폐와 위조지폐를 두고 차이를 구분해서 범인을 잡아냅니다.
출소한 범인은 다시 위조지폐를 더 진짜 지폐처럼 만들고 경찰은 더 세밀하게 관찰해서 위조지폐를 구별해 냅니다.
이 같은 과정을 수없이 반복하면 범인이 만든 위조지폐는 더 이상 진짜 지폐와 구별할 수 없는 상황까지 갑니다.
GAN 또한 이와 유사한 경쟁적 학습이라는 것을 통해 실물과 거의 차이가 없는 놀라운 결과물을 만들 수 있게 됩니다.
2. OpenAI의 설립
2015년에 설립된 OpenAI는 인공 일반 지능(AGI)을 모든 인류에게 혜택을 주도록 목표로 한 조직입니다.
주요 주최자인 샘 알트먼과 일론 머스크는 기술의 발전과 인류의 이익을 위해 OpenAI를 창설했습니다.
사실 저는 일론 머스크가 OpenAI의 주요 창립멤버라는 사실을 이번에 조사하면서 처음 알게 됬는데요. 천재들은 끼리끼리 논다더니… 정말 놀랍지 않나요?
OpenAI는 다양한 일반 인공 지능 서비스를 개발하여 제공하고 있으며, 그 중에서도 챗GPT, DALL-E, Code 등이 주목받고 있습니다.
이러한 서비스들은 생성형 AI의 다양한 측면에서 혁신을 이루고 있으며, 특히 챗GPT는 오픈AI의 대표작 중 하나로 평가받고 있습니다.
2019년 OpenAI는 MS(마이크로소프트)로부터의 큰 투자를 통해 오픈AI의 가치를 높였는데요. 그 투자 금액이 무려 10억달러 한화로 약 1조 3천억원 규모입니다. 이 결과로 MS는 OpenAI의 지분을 5% 확보 했는데요.
이뿐만 아니라 2023년 100억 달러 한화로 약 13조원에 달하는 천문학적인 규모의 자금을 다시 OpenAI에 투자하며 세상을 깜짝 놀라게 했습니다. 현재 OpenAI의 가치가 약 290억 달러라고 하는데 거의 1/3을 투자한 셈이니 빌게이츠의 통이 정말 남다르죠?
물론 실속도 제대로 챙긴것으로 보이는데요. OpenAI도 사업을 할려면 클라우드 서비스를 사용해야 하는데 투자의 조건 중 하나가 MS의 클라우드 서비스인 애저(Azure)를 사용하는 것이어서, OpenAI가 잘 나갈수록 MS의 주머니도 두둑해집니다.
정말 신의 한 수 인 것 같네요.
이처럼 MS는 클라우드 서비스를 통해 OpenAI의 결과물 제공 및 활용에 관한 독점권을 확보하는 등, 생성형 AI의 발전에 큰 역할을 하고 있습니다.
생성형 AI 기술
생성형 AI의 주요 목표는 혁신적이고 혹은 구별하기 어려운 새로운 콘텐츠를 생성하는 데에 있습니다. 이러한 기술의 핵심은 GAN을 포함한 딥러닝에 기반하고 있습니다.
딥러닝의 원리
딥러닝은 인공신경망을 활용한 기술로, 데이터의 흐름을 통해 가중치를 조절하여 복잡한 문제를 해결하는 방식을 채택하고 있습니다.
이는 생물의 신경망을 모방한 구조로, 데이터에 따라 신경 간의 가중치를 조절하여 학습하고 판단하는 방식입니다.
딥러닝은 기술적, 수학적 난제를 극복하면서 2010년대에 들어 급격한 발전을 이루어냈습니다.
딥러닝은 인공신경망을 활용한 기술로, 복잡한 문제를 해결하기 위한 학습 기반의 접근 방식을 제공합니다. 이 기술은 인간의 뇌의 작동 방식에서 영감을 받아 설계되었으며, 기계가 데이터를 기반으로 스스로 판단하고 학습하는 능력을 갖추게 합니다. 아래에서는 딥러닝의 주요 원리와 작동 방식을 설명하겠습니다.
1. 인공신경망 (Artificial Neural Network, ANN)
딥러닝의 핵심은 인공신경망입니다. 이는 뇌의 생물학적 신경망에서 영감을 받아 만들어진 구조로, 뉴런(노드)이라 불리는 단위들이 층(layer)을 형성하여 정보를 처리합니다. 각 뉴런은 입력을 받아 가중치와 함께 활성화 함수를 거쳐 출력을 생성합니다. 이렇게 연결된 뉴런들의 네트워크가 복잡한 계산을 수행하고 학습을 통해 문제를 해결합니다.
2. 가중치와 활성화 함수
가중치는 입력과 함께 곱해져 각 뉴런의 중요도를 나타내는 역할을 합니다. 학습 과정에서 이 가중치가 조정되어 입력 데이터를 더 잘 대표할 수 있는 모델이 만들어집니다. 활성화 함수는 각 뉴런의 출력을 결정하는 함수로, 비선형성을 추가하여 모델이 다양한 패턴을 학습할 수 있도록 돕습니다.
3. 층과 계층적 학습
인공신경망은 입력층, 은닉층, 그리고 출력층으로 구성됩니다. 은닉층은 중간 계층으로, 데이터의 추상적인 표현을 학습하고 고수준의 특징을 추출합니다. 이러한 층들이 계층적으로 구성되어 복잡한 패턴과 특징을 학습하게 됩니다.
4. 역전파 알고리즘 (Backpropagation)
역전파는 딥러닝에서 학습을 진행하기 위한 핵심 알고리즘 중 하나입니다. 이 알고리즘은 모델의 예측과 실제 결과의 오차를 최소화하기 위해 가중치를 조정합니다. 오차를 역방향으로 전파하며 각 층의 가중치를 조절하여 모델을 개선시킵니다.
5. 딥러닝의 확장과 발전
딥러닝은 초기에는 제한적인 데이터와 연산 능력으로 인해 한계를 가지고 있었지만, 현재는 대량의 데이터와 고성능 하드웨어의 발전으로 인해 많은 분야에서 높은 성능을 보이고 있습니다.
이미지 인식, 자연어 처리, 음성 인식 등 다양한 응용 분야에서 딥러닝이 혁신을 이루고 있으며, 지속적인 연구와 기술 발전이 이뤄지고 있습니다.
딥러닝은 문제에 따라 여러 층과 복잡한 구조의 인공신경망을 사용하여 데이터의 특징을 추출하고 학습하는 원리에 기반하고 있습니다. 이러한 원리들이 함께 작용하여 딥러닝은 다양한 분야에서 놀라운 성과를 내고 있으며, 계속해서 발전하고 있습니다.
GAN을 통한 생성형 AI
GAN은 2014년에 구글에서 발표된 기술로, 생성자와 평가자라는 두 신경망이 서로 경쟁하여 결과물을 생성하고 판별하는 방식으로 작동합니다.
이 경쟁적 학습을 통해 GAN은 놀라운 정도의 현실적인 가짜를 생성해냅니다. 예를 들어, 위조지폐를 만드는 범죄자가 더욱 완벽한 위조물을 만들어내려고 노력하는 과정과 유사합니다.
GAN은 이미지, 음악, 텍스트 등 다양한 분야에서 활용되며, 특히 이미지 생성 분야에서 높은 성과를 보여주고 있습니다.
딥러닝을 활용한 GAN
GAN은 딥러닝의 신경망 기술을 효과적으로 활용하는 대표적인 예시입니다.
이는 두 가지 신경망이 서로 경쟁하며 발전하고, 생성자는 더욱 현실적인 결과물을 만들어내기 위해 노력하고 평가자는 그 결과물을 진짜와 비교하여 향상시키는 구조를 갖추고 있습니다.
GAN은 마치 경찰이 위조지폐와 진짜 지폐를 번갈아 가면서 비교하는 상황과 유사한데, 이를 통해 생성자는 지속적으로 향상된 결과물을 만들어내게 됩니다.
이런 반복적 학습을 통해 GAN은 높은 확률로 현실과 구별하기 어려운 가짜를 생성해냅니다.
이러한 GAN의 발전은 이미지, 영상, 음악, 텍스트 등 여러 분야에서 혁신을 이끌어내고 있으며, 그 성과는 계속해서 진화하고 있습니다.
그러나 이에 따른 사회적 문제들에 대한 대응과 윤리적 고려가 뒤따라야 할 중요한 과제입니다.