AI가 직업의 80%를 대체한다는 그래프의 진짜 출처 Anthropic 경제 지수 보고서의 허점
Anthropic 경제 지수 보고서의 80% 직업 대체 그래프가 2023년 GPT-4 시대의 추측에 기반한 이유와 이론적 능력과 실제 사용 사이의 간극을 팩트체크한다
이번 달 소셜미디어에서 한 장의 그래프가 크게 퍼졌습니다. Anthropic이 발표한 AI 노동시장 영향 보고서에 포함된 것으로, 22개 직업군에 걸쳐 LLM(대규모 언어 모델)의 “이론적 능력” 이 각 직업 업무의 80% 이상을 수행할 수 있다는 내용입니다. 파란색 영역이 직업군 전체를 거의 뒤덮는 형태라, 한눈에 봐도 “AI가 대부분의 일자리를 위협한다”는 인상을 줍니다.
Ars Technica가 이 그래프의 원본 데이터를 추적했습니다. 결론부터 말하면, 이 “이론적 능력”의 근거는 2023년 8월 GPT-4 시대의 추측 이었습니다. 보고서 자체가 틀린 것은 아니지만, 그래프가 전달하는 인상과 데이터의 실체 사이에 큰 간극이 있습니다.
관련 브리핑과 뉴스원문은 AI코리아24 4월 1일 브리핑에서 확인할 수 있습니다.
80% 그래프의 원본은 2023년 GPT-4 시대의 추측이다
Anthropic이 인용한 “이론적 능력” 수치는 Anthropic 자체의 실험 결과가 아닙니다. 원본은 2023년 8월에 OpenAI, OpenResearch, 펜실베이니아대학교 연구자들이 공동으로 발표한 “GPTs are GPTs” 라는 논문입니다.
이 논문의 방법론은 다음과 같습니다. 미국 노동부의 O*NET(직업 정보 네트워크) 데이터베이스에서 각 직업의 세부 업무를 추출합니다. 그리고 당시 가장 강력했던 GPT-4가 각 업무의 소요 시간을 50% 이상 줄일 수 있는지 를 판단합니다. 만약 현재 모델로 안 되면, “미래에 등장할 LLM 기반 소프트웨어” 로 가능한지도 함께 판단합니다.
핵심적인 문제가 두 가지 있습니다. 첫째, 이 판단을 내린 사람들은 해당 직업의 종사자가 아니라 AI 전문가 들이었습니다. 연구자들도 이를 인정하며 “평가자들이 평가 대상 직업에 대해 대부분 알지 못했다”고 논문에 명시했습니다. 둘째, “미래에 등장할 소프트웨어”에 대해 언제까지라는 기한이 없었습니다 . 연구자들은 “LLM의 개발이나 도입 시점에 대한 예측을 하지 않는다”고 직접 썼습니다. 기한 없는 가능성은 예측이 아니라 희망입니다.
현재 GPT-4 단독으로 가능했던 범위는 극히 좁다

2023년 시점의 GPT-4만으로 50% 이상 효율화가 가능하다고 판단된 업무는 전체의 약 15% 에 불과했습니다. 전체 직업 중 업무의 절반 이상이 LLM에 노출된 직업은 2.3% 뿐이었습니다.
80%라는 숫자가 나오려면 “미래에 등장할 LLM 기반 소프트웨어”의 효과까지 포함해야 합니다. 이 소프트웨어가 언제 나올지, 실제로 작동할지에 대한 근거는 없습니다. 그래프의 파란색 영역은 이 미래 소프트웨어의 효과까지 모두 합산한 것입니다. 현재 관측된 실제 AI 노출도를 나타내는 빨간색 영역은 파란색에 비해 극히 일부입니다.
Anthropic 스스로도 “실제 활용은 이론적 가능성의 일부에 머물러 있다(actual coverage remains a fraction of what’s feasible)“고 인정합니다. 그리고 현재까지의 실업률 데이터에서 AI 노출이 높은 직업군과 낮은 직업군 사이에 차별적 영향이 관측되지 않았다 고 밝혔습니다.
이론과 현실 사이의 거리를 보여주는 사례들
이론적 가능성과 실제 현장의 괴리는 다른 데이터에서도 확인됩니다. 2025년에 발표된 한 연구에서는 오픈소스 개발자가 AI 도구를 사용했을 때 오히려 19% 느려졌다 는 결과가 나왔습니다. 프롬프트를 작성하고 생성된 코드를 검토하는 데 드는 시간을 합산하면, AI 없이 직접 코딩하는 것보다 더 오래 걸렸다는 것입니다.
커머스 분야에서도 비슷한 패턴이 관측됩니다. 월마트가 ChatGPT 안에서 약 20만 개 상품을 대상으로 실시한 Instant Checkout 실험에서, ChatGPT 내 결제 전환율은 월마트 자체 사이트의 약 3분의 1 수준에 그쳤습니다. AI 트래픽의 77%는 상품 검색에 머물렀고, 실제 결제로 이어진 비율은 2.3% 에 불과했습니다. “AI가 커머스를 대체한다”는 이론과 “AI가 결제 하나 제대로 완료하지 못한다”는 현실 사이의 거리입니다.
원문 논문의 평가 루브릭에는 LLM이 잘할 수 있는 업무의 예시로 텍스트 변환, 코드 작성, 번역, 요약, 문서 피드백 등이 나열되어 있습니다. 이것들은 실제로 LLM이 잘하는 영역이 맞습니다. 그러나 “어떤 업무를 어느 정도 할 수 있다”는 것과 “그 업무를 맡은 사람을 대체할 수 있다”는 것은 전혀 다른 주장입니다. 연구자들도 “노동을 보강하는 효과와 노동을 대체하는 효과를 구분하지 않았다”고 명시했습니다.
그래프가 만드는 공포와 데이터가 말하는 현실
이 보고서가 위험한 이유는 내용이 틀려서가 아닙니다. 내용은 조건부로 맞습니다. 위험한 것은 그래프가 전달하는 인상 입니다. 22개 직업군을 파란색이 뒤덮는 이미지는 “AI가 곧 대부분의 일자리를 가져간다”는 메시지로 읽힙니다. 그러나 실제 데이터는 “2023년 AI 전문가들이 미래 소프트웨어의 가능성을 기한 없이 추정한 결과”입니다.
Anthropic은 AI 안전을 핵심 가치로 내세우는 기업입니다. 그 기업이 발표한 보고서가 AI의 위협을 과대 표현하는 그래프를 포함하고 있다는 점은 아이러니입니다. 물론 Anthropic 자체가 이 데이터를 만든 것은 아니고, 원본 논문을 인용한 것입니다. 그러나 인용의 맥락과 그래프의 시각적 설계는 Anthropic의 선택입니다.
AI가 일자리에 영향을 미칠 것이라는 방향성 자체는 부정하기 어렵습니다. 그러나 “80%“라는 숫자의 출처가 기한 없는 추측이라는 사실, 현재 관측된 실제 노출은 그 극히 일부라는 사실, 그리고 고용 데이터에서 아직 차별적 영향이 관측되지 않았다는 사실은 함께 전달되어야 합니다. 공포는 수치에서 오지 않습니다. 수치의 맥락이 빠졌을 때 옵니다.
#Anthropic #AI일자리 #경제지수 #GPT4 #AI직업대체 #AI고용영향 #환각 #팩트체크