AI가 사회를 살아보는 시대 – 디지털트윈과 시뮬레이션이 정책을 바꾼다

2025. 5. 16. 01:09서비스디자인/정책디자인

인간 모방에서 사회 모방으로

AI는 인간의 언어, 판단, 정체성까지 복제 가능한 존재로 진화하고 있다. 2023년, 스탠퍼드대학교 박준성 연구팀은 인공지능(AI)이 한 개인의 기억과 성향, 성격을 복제하는 데 단 2시간의 인터뷰면 충분하다는 연구 결과를 발표했다. 연구진은 인터뷰 데이터를 바탕으로 참가자의 복제 에이전트를 만들었고, 이 AI는 2주 간격으로 성격 검사, 사회적 판단 과제, 논리 문제 등 일련의 테스트를 수행했다. 그 결과, 복제 AI는 실제 인간과 85% 이상 일치하는 반응을 보였다.  
출처: arXiv, 2023.09

단 2시간으로 개인의 성격을 복제할 수 있다면, 조직이나 사회의 복제도 가능하지 않을까?
같은 해, 박준성 연구팀은 GPT 기반 AI를 활용해 가상의 마을 '스몰빌 Smallville'을 구축했다. 이 마을의 AI 시민들은 각자 성격과 기억을 지닌 채 자율적으로 일정을 계획하고, 이웃과 대화를 나누며, 친구를 사귀고, 심지어 소문을 퍼뜨리기까지 했다. 한 에이전트가 파티를 기획하면, 다른 에이전트들이 이를 접하고 대화를 나누며, 참석 여부를 결정하는 일련의 사건들이 자연스럽게 전개된다.
이는 단순한 기술 시연이 아니라, 사회를 구성하는 인간의 상호작용과 문화적 동역학을 디지털 공간에서 시연하는 실험이었다. 언뜻 보기에는 심시티(SimCity) 같은 시뮬레이션 게임을 떠올릴 수도 있지만, 그 본질은 다르다. 심시티는 사용자가 도시를 설계하고 개입하는 게임이지만, 스몰빌은 연구자가 개입하지 않고 AI 에이전트가 자율적으로 관계를 맺고, 일정을 계획하며, 사회를 형성해 나간다. 즉, 스몰빌은 인간 사회를 구성하는 행동 원리를 관찰할 수 있도록 설계된 하나의 '디지털 사회 실험실'이다. 
출처: Generative Agents 논문, arXiv, 2023.04 

AI는 사회를 이렇게 시뮬레이션한다

Smallville 실험과 성격 복제 모델은 AI가 인간 행동을 정밀하게 재현할 수 있다는 가능성을 보여준다. AI는 한 사람의 행동을 복제하는 수준을 넘어, 정책, 제도, 문화, 사회 시스템 자체를 실험할 수 있는 도구로 진화하고 있다.
AI 기반 사회 시뮬레이션 분야에서 특히 주목받고 있는 흐름은 다음 세 가지다:

Multi-Agent Social Simulation : GPT 기반 AI 수천 명이 자율적으로 상호작용하며 정책의 파급 효과, 사회적 반응의 패턴을 실험한다. Generative Agents 이후 AgentSociety 등 다수의 프로젝트가 이 흐름에 속한다. 출처: AgentSociety, arXiv, 2024.02

Social Digital Twin (사회적 디지털트윈) : 기존의 디지털트윈이 건물, 도로, 전력망 등 물리 기반 시스템을 복제했다면, 사회적 디지털트윈은 정책 반응, 감정 변화, 문화 전파, 루머 확산 같은 사회적 상호작용까지 복제하는 모델이다. 출처: Fujitsu Research

AI for Policy Experimentation실제 정책을 시행하기 전에, AI 기반의 가상 사회에서 시나리오를 먼저 실행해보고, 그 결과를 예측하거나 최적 정책을 설계하는 실험 플랫폼이 확산되고 있다. 출처: OECD OPSI

이 세 가지 흐름은 독립적으로 발전해왔지만, 모두 다음 질문에 도달하고 있다.

"정책을 시행하기 전에 먼저 실험해 볼 수는 없을까?"

 

정책 실험은 왜 어려웠는가?

정책이 수많은 사람에게 영향을 미치는 만큼, 시행 전에 시험한다는 발상에는 윤리적·정치적 부담이 따랐다. 이를 피하기 위해 '시범사업'이라는 방법이 주로 사용되어 왔으나, 최근에는 문제 해결 중심의 접근과 증거 기반 정책 설계가 확산되면서 정책 실험의 필요성과 정당성이 다시 주목받고 있다.
정책 수립 초기 단계에서의 혁신 필요성은 ‘정책랩(Policy Lab)’이라는 조직적 실험으로 이어졌다. 정책랩은 정부 내외부 이해관계자가 협업해 문제를 재정의하고 해법을 도출하는 내부 혁신 메커니즘이자 수요자 중심 설계를 촉진하는 구조다. 영국의 Policy Lab, 미국의 Lab@OPM, 호주의 BETA(Behavioural Economics Team of the Australian Government) 등은 공무원, 디자이너, 연구자, 시민이 함께 정책을 설계하고 실험하는 구조를 운영하고 있으며, 이러한 흐름은 점차 제도화되고 있다.
* 정책랩에 대한 소개 보기 : 정책을 디자인하는 조직, 정책랩에 주목해야 하는 이유


반면, AI 기반 사회 시뮬레이션은 수천, 수만 개의 행위자 모델을 설정하고, 가상의 집단 사회를 대상으로 정책 변화에 따른 반응을 수치화하고 예측하는 실험 환경이다. 정책랩이 사람들의 관행적인 사고방식을 바꾸는 ‘기획 실험’이라면, 소셜시뮬레이션은 집단 행동을 계량적으로 관측하는 ‘계산 실험’에 가깝다.
수많은 AI 행위자가 일정한 사회적 조건 안에서 반응하고 상호작용하는 환경은, 새로운 정책을 시행하기 전에 대규모 집단의 행동 예측을 가능하게 해준다. 기존에는 수백만 명을 대상으로 정책을 적용해본다는 것은 시간과 비용 면에서 불가능했다. 
예를 들어, 자전거 도로를 어디에 설치하느냐에 따라 교통량, 상권, 안전, 환경 모두가 영향을 받는다. 모든 경우의 수를 예상하기란 불가능하기에 기존에는 전문가의 직관이나 통계에 의존할 수 밖에 없었다. 이제는 바둑 AI가 모든 수를 읽어 최적의 수를 선택하듯,  AI 시뮬레이션이 경우의 수를 가능한 많이 실행해보고 그 결과에 따라 가장 바람직한 결과를 도출할 수 있다.

디지털트윈이 공간을 복제했다면, AI는 사회를 복제한다

디지털트윈은 물리적 공간과 시스템을 정밀하게 복제해 도시 운영과 인프라 관리를 최적화할 수 있게 했다. 이에 비해 AI 기반 소셜시뮬레이션은 그 복제된 사회 안에서 사람들의 행동과 집단 반응을 실험해, 정책 변화가 어떤 영향을 줄지를 정량적으로 탐색할 수 있게 한다.
바로 이 지점에서 '소셜시뮬레이션(social simulation)'의 가치가 드러난다. 사회를 구성하는 다양한 행위자(agent)를 모델링하고, 상호작용 구조와 맥락적 반응을 설정해 제도 변화나 외부 충격에 대한 집단적 반응을 정량적으로 관찰할 수 있는 실험 환경이다.
다음은 대표적 소셜시뮬레이션의 예이다.

AgentSociety
GPT 기반 AI 에이전트 10,000개를 가상의 사회에 배치해, 정책 변화(예: 기본소득 도입)나 외부 충격(예: 허리케인 발생)에 따른 사회적 반응을 시뮬레이션한다.
→ 정책 도입 전 사회적 영향 예측, 위험 요소 사전 식별.
URL: https://arxiv.org/abs/2502.08691

MOSAIC
소셜미디어 환경을 디지털로 재현하고, AI 에이전트들이 '좋아요', '댓글', '공유', '신고' 등의 행동을 하며 콘텐츠 확산과 허위정보 전파를 분석한다.
→ 플랫폼 정책 설계, 정보 확산의 사회적 경로 예측.
URL: https://arxiv.org/abs/2504.07830

Large Social Simulator (중국)
수천만 명 규모의 도시 인구를 기반으로 한 가상환경을 구축해, 교통 혼잡, 감염병 확산, 학교폭력 등 복합 사회문제를 실험한다.
→ 도시정책 수립, 사회문제 조기경고 시스템 설계.
URL: https://www.globaltimes.cn/page/202410/1321892.shtml

CulturePulse (UNDP 협력)
중동 분쟁처럼 복잡한 사회 갈등 상황에서, 소셜미디어 데이터를 기반으로 AI가 개인의 심리·정서적 반응과 의견 변화를 시뮬레이션한다.
→ 위기 커뮤니케이션 전략 수립, 문화적 민감성 분석.
URL: https://www.wired.com/story/culturepulse-ai-israeli-palestinian-crisis

OASIS
수백만 개의 AI 에이전트가 디지털 네트워크 상에서 뉴스, 여론, 감정 전염 현상을 자율적으로 형성하며 사회적 현상을 재현한다.
→ 정책 캠페인 효과 예측, 허위정보 대응 전략 설계.
URL: https://www.camel-ai.org/blogs/project-oasis-automation-or-simulation---the-biggest-potential-of-multi-agent-systems  

우리의 과제와 기회

한국은 디지털 정부를 추진하고 있지만, 정책 수립 단계에서 정책의 사회적 반향을 시뮬레이션하거나 예측할 수 있는 기반은 미비하다. 디지털트윈 기술은 주로 공공시설 운영이나 도시계획 같은 물리 기반 인프라에 집중되어 있고, 국민디자인단, 리빙랩과 같은 참여 기반 정책 실험 제도가 일부 존재하지만, AI 기반 사회 시뮬레이션과 결합된 피드백 시스템은 부재한 상황이다.
지금 필요한 것은 다음과 같다.

  • 사회적 디지털트윈 모델링 – 물리 + 사회 데이터를 통합해 디지털 사회 실험장 구축
  • AI 정책 실험실 제도화 – 리빙랩 + 에이전트 시뮬레이션 통합
  • AI 기반 정책 R&D 체계화 – 시행 전 시뮬레이션을 통한 정책 설계 고도화

이제 AI는 우리 미래를 대신 살아보고 그 결과를 보여줄 수 있는 여건을 제공하고 있다. 
우리는 그 결과를 이해하고, 더 나은 결정을 내릴 준비를 해야 한다.

2025.5.16. 윤성원


용어 해설

정책랩 (Policy Lab): 정부 내외부에서 정책 기획 초기 단계에 다양한 이해관계자와 협업하여 문제를 재정의하고 해법을 공동 설계하는 실험적 조직 또는 팀. 다양한 부처와 시민, 전문가가 협업하도록 설계된 내부 혁신 메커니즘이자 수요자 중심 정책 설계를 촉진하는 구조라 할 수 있다. 인터뷰, 시나리오 워크숍, 정책 페르소나, 공동 브레인스토밍 등 다양한 디자인 방법을 활용해 수요자 중심의 혁신을 설계한다.
디지털트윈 (Digital Twin): 실제 물리 공간이나 시스템을 디지털 환경에 정밀하게 복제해 운영을 최적화하거나 변화 예측에 활용하는 기술.
소셜시뮬레이션 (Social Simulation): AI나 수학 모델을 통해 사회적 행위자들이 상호작용하는 과정을 시뮬레이션하고, 정책이나 외부 변화에 대한 집단 반응을 분석하는 실험 기법.
멀티에이전트 시뮬레이션 (Multi-agent Simulation): 독립적으로 행동하는 수많은 가상의 행위자(agent)를 모델링해 사회적 시스템의 거동을 탐구하는 시뮬레이션 방식.