뉴스

AI 워크슬롭 지식부패 경고 하버드비즈니스리뷰가 본 기업의 숨은 손실

HBR이 경고한 AI워크슬롭과 지식부패 현상 연간 9백만달러 손실 구조와 기업이 놓치고 있는 함정을 분석합니다

#AI워크슬롭 #지식부패 #하버드비즈니스리뷰 #AI생산성 #knowledgedecay #AI도입실패 #기업AI전략
AI 워크슬롭 지식부패 경고 하버드비즈니스리뷰가 본 기업의 숨은 손실

생성형 AI 도입에 가장 적극적이었던 기업들이 정작 일의 품질 저하라는 역설적인 문제에 직면하고 있습니다. 하버드비즈니스리뷰(HBR)가 이번 달 게재한 두 편의 글은, AI가 생성한 저품질 결과물이 쌓이면서 기업이 의사결정에 활용하는 정보 기반 자체가 무너지는 현상을 ‘지식 부패(knowledge decay)‘라는 용어로 설명했습니다.

이 개념은 단순한 AI 환각(AI가 사실이 아닌 내용을 그럴듯하게 만들어내는 현상) 문제와는 결이 다릅니다. 오류 하나하나가 아니라, 저품질 AI 결과물이 몇 달에 걸쳐 조직 전체에 누적되면서 만들어내는 구조적 손상을 가리킵니다. AI 도입을 검토하거나 이미 전사적으로 활용 중인 기업이라면 반드시 짚고 넘어가야 할 문제입니다.

기사원문보기

AI 워크슬롭 핵심 내용 정리

옥스퍼드대 운영관리학 교수 매티아스 홀웨그와 밥슨칼리지의 토머스 데이븐포트 교수가 작성한 HBR 6월 글은, 직원이 AI로 겉보기에는 완성도 있어 보이지만 실수가 있거나 내용이 부실한 결과물을 만들었을 때, 후속 단계의 동료들이 이를 검증하고 수정하고 다시 만드는 데 시간을 낭비하게 된다고 지적합니다. 이런 오류가 팀과 부서를 넘나들며 쌓이면 조직의 집단 지식 기반 자체가 점점 나빠진다는 것입니다.

이런 저품질 결과물을 가리키는 용어인 ‘워크슬롭(workslop)‘은 베터업 랩스와 스탠퍼드 소셜미디어랩이 2025년 9월 HBR 기고문에서 처음 만든 표현입니다. 미국 정규직 근로자 1150명을 대상으로 한 조사에서 41퍼센트가 최근 한 달 안에 워크슬롭을 받은 적이 있다고 답했고, 건당 평균 1시간 56분이 처리하는 데 소요됐습니다. 응답자들의 급여와 소요 시간을 기준으로 계산하면 워크슬롭은 근로자 1인당 월 186달러의 비용을 발생시키며, 직원 1만 명 규모 기업이라면 연간 900만 달러 이상의 생산성 손실로 이어집니다.

왜 이 시점인가 AI 생산성 신화의 균열

이 경고가 나온 시점은 의미심장합니다. 2025년 7월 MIT 미디어랩 보고서는 조사 대상 조직의 95퍼센트가 생성형 AI 투자에서 측정 가능한 수익을 얻지 못했다고 발표했고, 2026년 3월 골드만삭스 역시 S&P500 경영진의 70퍼센트가 실적 발표에서 AI를 언급함에도 불구하고 AI 도입과 생산성 향상 사이에 의미 있는 상관관계를 찾지 못했다고 결론지었습니다.

지식 부패 개념은 이런 흐름 위에서 한 걸음 더 나아간 설명을 제공합니다. AI가 개별 작업을 더 빠르게 만들었는지를 묻는 차원을 넘어, AI를 광범위하게 사용한 결과 조직의 의사결정 전체가 더 나아졌는지 나빠졌는지를 물어야 한다는 것입니다. 골드만삭스, MIT, 보스턴컨설팅그룹(BCG), 그리고 서로 다른 두 연구팀이 작성한 HBR 글까지, 여러 출처가 비슷한 결론에 도달하고 있다는 점이 이 문제의 무게를 더합니다.

사회적 비용과 채용 과정의 신뢰 붕괴

지식 부패가 만드는 손실은 금전적인 부분에 그치지 않습니다. 베터업과 스탠퍼드의 조사에서 워크슬롭을 받은 근로자의 53퍼센트는 짜증을 느꼈다고 답했고, 42퍼센트는 보낸 사람을 덜 신뢰하게 됐다고 응답했습니다. 절반가량은 그 동료를 창의적이거나 유능하거나 신뢰할 만한 사람으로 덜 여기게 됐다고 답했으며, 3분의 1은 그 동료와 다시 일하고 싶지 않다고 밝혔습니다.

특히 채용 과정의 손상이 두드러집니다. AI로 작성된 이력서가 채용 담당자에게 쏟아지고, AI가 작성한 채용 공고가 지원자를 오도하며, AI 기반 선별 도구가 적격 지원자를 걸러내는 일이 반복되면서 구직자와 채용 담당자 양쪽 모두에서 채용 절차에 대한 신뢰가 역대 최저 수준으로 떨어졌다고 HBR은 지적합니다. 여기에 더해 2026년 미국, 영국, 유럽 2400명 대상 조사에서는 응답자의 29퍼센트가 가이드라인 무시나 교육 거부, 성과 데이터 왜곡 등으로 회사의 AI 전략을 의도적으로 방해한 적이 있다고 답했고, Z세대에서는 그 비율이 44퍼센트까지 치솟았습니다. 일자리 대체에 대한 두려움이 주된 원인으로 꼽힙니다.

국내 기업에 미치는 시사점

국내 기업 입장에서 이 보고서가 주는 메시지는 명확합니다. AI 도입 속도 자체를 성과 지표로 삼는 접근은 위험할 수 있다는 점입니다. 특히 인력 감축을 AI 생산성 향상과 연결짓는 결정을 내린 기업이라면, 워크슬롭으로 인한 검증과 재작업 부담이 줄어든 인력으로는 감당하기 어려운 수준까지 누적될 수 있다는 점을 점검할 필요가 있습니다.

HBR의 두 글 모두 무차별적인 AI 의무 사용과 목적에 맞는 선택적 활용을 구분하고 있다는 점도 주목할 만합니다. 회사 고유 데이터로 학습된 전용 모델은 실질적인 가치를 더할 수 있지만, 적합하지 않은 작업에 범용 거대언어모델(LLM)을 적용하면 실수가 포함된 일반적인 산문만 양산하게 된다는 지적입니다. 이는 국내 기업들이 챗GPT나 클로드 같은 범용 도구를 무분별하게 모든 업무에 적용하기보다, 검증 가능한 영역을 선별해 단계적으로 도입하는 전략을 고민해야 한다는 의미로 읽을 수 있습니다.

주목해야 할 포인트

이 보고서가 던지는 가장 날카로운 역설은, 워크슬롭 문제를 해결하려면 AI가 줄여줬어야 할 바로 그 종류의 노동, 즉 검증 절차와 품질 기준, 인간의 감독이 다시 필요해진다는 점입니다. 기업이 AI 산출물 위에 새로운 검증 레이어를 쌓아야 한다면, 애초에 AI 도입을 정당화했던 효율성 논리 자체가 흔들릴 수밖에 없습니다.

다만 지식 부패 프레임워크가 아직 통제된 실증 연구를 거치지 않았다는 점은 짚고 넘어갈 필요가 있습니다. 베터업과 스탠퍼드의 워크슬롭 조사도 응답자의 자기 보고에 의존한 추정치이며, 근로자가 재작업에 들인 시간을 얼마나 정확히 인지하는지는 별도로 검증돼야 할 부분입니다. 그럼에도 여러 독립적 연구가 비슷한 결론에 수렴하고 있다는 사실은 가볍게 넘길 수 없는 패턴입니다.

생성형 AI는 개별 작업의 속도를 높여줄 수 있지만, 품질 관리 체계 없이 도입될 경우 오히려 조직의 집단 지식을 갉아먹는 역효과를 낼 수 있습니다. AI 도입의 성패를 가르는 기준은 더 이상 도입 속도가 아니라, 검증 체계를 함께 갖췄는지에 달려 있습니다.

#AI워크슬롭 #지식부패 #하버드비즈니스리뷰 #AI생산성 #AI도입실패 #기업AI전략 #knowledgedecay

함께 읽으면 좋은 글

📋 CertKorea

2026년 국가자격증 시험일정을 한눈에 확인하세요. 613개 자격증의 필기·실기 D-day 카운트다운.

자격증 시험일정 확인하기 →
📊 한국인 AI 페르소나

나와 비슷한 한국인은 어떻게 살까? 나이·성별·지역만 입력하면 주거·직업·소득을 통계로 분석해드려요.

내 페르소나 분석하기 →
← 블로그 목록으로
링크가 복사되었습니다!