SMW MAGAZINE
서울메타위크 매거진
[SMW Vol.11] Ep.2 AI 치매: 모델 생성 콘텐츠의 과제와 AI 시스템에 미치는 영향
2023-06-12

AI 기술의 급속한 발전은 자연어 처리와 이미지 생성 분야에서 놀라운 성과를 가져왔다. GPT-2, GPT-3(.5), GPT-4와 같은 대규모 언어 모델(LLM)은 다양한 언어 작업에서 괄목할 만한 성능을 보여줬으며, ChatGPT와 같은 모델은 이러한 언어 기능을 일반 대중에게 소개했다. 그러나 LLM이 점점 더 널리 보급되고 온라인에서 발견되는 언어에 크게 기여함에 따라 연구자들은 “모델 치매”라는 우려스러운 문제를 발견했다.

최근 기사에서 연구자들은 원본 콘텐츠 분포의 꼬리가 사라질 때 모델에서 발생하는 돌이킬 수 없는 결함을 의미하는 모델 치매 현상에 대해 조명했다. 이 연구는 훈련 중에 모델 생성 콘텐츠를 사용하면 결과 모델에서 이러한 인지 저하가 발생할 수 있음을 나타낸다. 이러한 효과는 변형 자동 인코더(VAE), 가우시안 혼합 모델(GMM), LLM에서 관찰되었다. 이번 연구 결과는 인터넷에서 얻은 대규모 데이터에 대한 모델 학습의 이점을 보존하기 위해 이 문제를 해결해야 할 필요성을 강조한다.

연구진은 모델 치매에 대한 이론적 이해를 제공하고 다양한 생성 모델에서 치매의 유병률을 입증한다. 연구자들은 광범위한 웹 데이터에 대한 모델 학습의 지속적인 효과를 보장하기 위해 이 현상을 심각하게 고려해야 한다고 주장한다. 온라인에서 사용할 수 있는 언어와 콘텐츠에 LLM이 점점 더 많이 기여함에 따라 시스템과 인간의 실제 상호 작용에서 수집된 데이터의 가치는 더욱 중요해지고 있다.

설명적 텍스트에서 이미지 생성에 혁명을 일으킨 기술인 안정적 확산의 도입은 콘텐츠 생성에 있어 LLM의 영향력을 더욱 잘 보여준다. 그러나 이 연구에 따르면 모델 생성 콘텐츠를 사용할 경우 테일엔드 콘텐츠 배포가 손실되어 원본 데이터의 다양성과 풍부함이 약화될 수 있다.

웹에서 스크랩한 대규모 데이터는 시스템과 인간의 상호 작용에 대한 귀중한 인사이트를 제공하지만, LLM이 생성한 콘텐츠가 존재하면 새로운 과제가 발생한다. 연구진은 모델 치매 문제를 해결하고 인터넷 데이터에 대한 모델 학습의 이점을 보존하는 동시에 원본 콘텐츠 배포의 잠재적 손실을 완화할 수 있는 솔루션을 찾아야 한다고 강조한다.

AI 분야가 계속 발전함에 따라 연구자, 개발자, 정책 입안자는 모델 생성 콘텐츠에 대한 모델 학습과 관련된 한계와 과제를 인식하는 것이 중요하다. 모델 치매와 같은 문제를 이해하고 해결함으로써 향후 AI 기술의 책임감 있고 효과적인 사용을 보장할 수 있다.

RELATED EPISODES
Stay Tuned
뉴스레터를 구독하고 서울메타위크 소식지를 받아보세요