뉴스

GPT-5.5 Instant 출시 환각 52.5% 감소와 메모리 소스 기능이 바꾸는 ChatGPT 일상 사용

OpenAI가 ChatGPT 기본 모델을 GPT-5.5 Instant로 교체했다 의학 법률 금융 분야 환각이 52.5% 줄었고 AI가 어떤 기억을 참조했는지 사용자가 직접 볼 수 있는 메모리 소스 기능이 추가됐다 실제 달라지는 것을 분석한다

#GPT5.5Instant #ChatGPT업데이트 #AI환각감소 #메모리소스 #OpenAI #ChatGPT개인화 #GPT5.5 #AI신뢰성
GPT-5.5 Instant 출시 환각 52.5% 감소와 메모리 소스 기능이 바꾸는 ChatGPT 일상 사용

ChatGPT를 매일 쓰는 사람들에게 조용하지만 중요한 변화가 생겼습니다. OpenAI가 2026년 5월 5일 ChatGPT의 기본 모델을 GPT-5.3 Instant에서 GPT-5.5 Instant로 교체했습니다. 모든 ChatGPT 사용자에게 즉시 적용됩니다.

숫자 하나가 이 업데이트의 핵심을 설명합니다. 의학, 법률, 금융 분야의 고위험 질문에서 환각(hallucination, AI가 사실과 다른 내용을 사실처럼 생성하는 현상) 발생률이 52.5% 감소했습니다. 같은 질문에 이전 모델이 틀린 정보를 5번 생성했다면, 새 모델은 2~3번으로 줄었다는 의미입니다. 기사 원문은 AI코리아24 브리핑에서 확인할 수 있습니다.

GPT-5.5 Instant, 실제로 무엇이 달라졌는가

벤치마크 수치부터 정리하겠습니다.

경쟁 수학 시험인 AIME 2025에서 정확도가 65.4%에서 81.2%로 올랐습니다. 박사급 과학 추론을 테스트하는 GPQA는 78.5%에서 85.6%로 상승했습니다. 과학 차트를 해석하는 CharXiv 벤치마크는 75.0%에서 81.6%로 개선됐습니다. 텍스트와 이미지를 함께 처리하는 전문가 수준 추론 벤치마크 MMMU-Pro는 69.2%에서 76.0%로 높아졌습니다. 복잡한 문서에서 구조화된 데이터를 추출하는 OmniDocBench는 오류율이 14.6%에서 12.5%로 내려갔습니다.

OpenAI가 공개한 구체적인 사례가 이 개선을 가장 잘 보여줍니다. 사용자가 손으로 쓴 방정식 사진을 올리고 계산 결과를 확인해달라는 상황입니다. 이전 모델인 GPT-5.3 Instant는 처음에 사용자의 틀린 계산에 동의했다가, 나중에 x=3이 맞지 않는다는 것을 발견했지만 “실수 해가 없다”는 잘못된 결론을 냈습니다. GPT-5.5 Instant는 마찬가지로 처음에 동의했다가, 사용자가 방정식을 재배열하는 과정의 오류를 정확히 짚어내고 수정된 이차방정식을 올바르게 풀었습니다.

이것은 단순한 계산 정확도가 아닙니다. 사용자가 틀렸을 때 그것을 감지하고 바로잡는 능력, 즉 인간 오류를 교정하는 능력의 개선입니다.

메모리 소스 기능이 AI 신뢰성에 던지는 질문

이번 업데이트에서 기술적 성능 향상 못지않게 중요한 것이 메모리 소스(memory sources) 기능입니다.

지금까지 ChatGPT가 과거 대화나 저장된 정보를 참조할 때, 사용자는 AI가 어떤 기억을 활용했는지 알 수 없었습니다. 이제 AI가 저장된 컨텍스트(context, 맥락 정보)를 참조해 답변을 생성하면, 어떤 정보가 활용됐는지가 표시됩니다. 과거 특정 대화의 내용인지, 저장된 메모인지, 업로드한 파일인지를 확인할 수 있습니다. 사용자는 각각의 항목이 관련 있는지 없는지를 표시하거나, 수정하거나, 삭제할 수 있습니다.

이 기능이 중요한 이유가 있습니다. 지금까지 AI의 개인화는 블랙박스에 가까웠습니다. AI가 왜 이런 답변을 했는지, 어떤 맥락을 참조했는지가 불투명했습니다. 메모리 소스는 그 블랙박스의 일부를 여는 시도입니다.

다만 한계도 명확합니다. OpenAI는 메모리 소스가 모델이 참조한 모든 요소를 보여주지는 않는다고 밝혔습니다. 일부 검색한 대화만 소스로 표시됩니다. 즉 완전한 투명성이 아니라 선택적 공개입니다. 또한 대화를 공유할 때 메모리 소스는 전달되지 않으며, 임시 대화 모드에서는 메모리를 읽거나 업데이트하지 않습니다.

간결해진 답변 — 덜 쓰고 더 전달한다

GPT-5.5 Instant의 또 다른 변화는 답변 스타일입니다. OpenAI는 “같은 정보를 더 적은 분량으로, 더 높은 유용성으로 전달할 수 있다”고 설명했습니다.

구체적으로는 불필요한 후속 질문을 줄이고, 과도한 이모티콘 사용을 없애고, 무거운 서식(헤더, 불릿 포인트 남용)을 축소했습니다. 답변 길이 자체가 짧아졌습니다.

이것은 사용자가 ChatGPT에 지속적으로 불만을 제기해온 부분입니다. 간단한 질문에도 불필요하게 길고 형식적인 답변을 내놓는 경향, 과도한 공감 표현, 당연한 내용을 반복하는 습관이 대표적입니다. GPT-5.5 Instant는 이 방향의 교정을 시도합니다.

개인화 측면에서도 개선이 이루어졌습니다. 과거 대화, 업로드한 파일, 연결된 Gmail 계정의 정보를 더 적절하게 활용한다고 OpenAI는 밝혔습니다. 단순히 더 많은 정보를 참조하는 것이 아니라, 언제 개인화가 실제로 도움이 되는지를 더 잘 판단한다는 것입니다.

출시 방식과 플랜별 접근 차이

GPT-5.5 Instant는 모든 ChatGPT 사용자에게 즉시 적용됩니다. 무료 사용자도 포함됩니다.

기존 GPT-5.3 Instant는 3개월 더 사용할 수 있습니다. 유료 구독자는 설정에서 이전 모델로 전환하는 선택이 가능합니다.

개인화 기능은 단계적으로 출시됩니다. 과거 대화, 파일, Gmail 연동 기반 개인화는 먼저 Plus와 Pro 구독자에게 웹 버전으로 제공되고, 이후 모바일과 다른 플랜으로 확장됩니다. 메모리 소스는 모든 소비자 플랜에 웹 버전부터 제공됩니다. 일부 개인화 기능은 지역에 따라 제공되지 않을 수 있습니다.

참고로 GPT-5.5에는 두 가지 버전이 있습니다. 이번에 기본 모델로 적용된 GPT-5.5 Instant는 빠른 일상 사용에 최적화된 버전입니다. 더 강력한 GPT-5.5 Thinking은 사이버 보안 테스트에서 Claude Mythos와 대등한 수준을 보이는 상위 모델로 별도로 운영됩니다.

환각 52.5% 감소를 어떻게 받아들여야 하는가

52.5%라는 수치는 인상적이지만, 맥락이 필요합니다.

이것은 OpenAI의 내부 테스트 결과입니다. 외부 독립 검증이 아닙니다. 또한 “고위험 주제의 환각이 52.5% 감소”했다는 것은 여전히 절반 가까운 경우에 환각이 발생할 수 있다는 의미이기도 합니다. 의료, 법률, 금융 분야에서 AI 답변을 그대로 신뢰하는 것은 여전히 위험합니다.

그러나 방향은 분명합니다. OpenAI는 환각 문제를 AI 신뢰성의 핵심 과제로 정의하고, 이것을 모델 업데이트의 주요 지표로 공개하기 시작했습니다. 이 자체가 의미 있는 변화입니다. 환각을 줄이는 것이 AI 개발의 명시적 목표로 설정되고, 그 진척 상황이 수치로 공개되는 구조는 사용자와 기업 모두에게 더 명확한 기준을 제공합니다.

ChatGPT를 업무에 활용하는 한국 사용자와 기업 입장에서 가장 실질적인 변화는 두 가지입니다. 의학·법률·금융 분야 질의에서 틀린 정보를 제공받을 위험이 낮아졌다는 것, 그리고 AI가 어떤 맥락을 참조했는지를 확인하고 통제할 수 있게 됐다는 것입니다. 완전한 해결이 아닌 개선이지만, AI를 더 안심하고 사용할 수 있는 방향으로 나아가고 있습니다.

#GPT5.5Instant #ChatGPT업데이트 #AI환각감소 #메모리소스 #OpenAI #AI개인화 #ChatGPT신뢰성 #AI신뢰성

함께 읽으면 좋은 글

📋 CertKorea

2026년 국가자격증 시험일정을 한눈에 확인하세요. 613개 자격증의 필기·실기 D-day 카운트다운.

자격증 시험일정 확인하기 →
📊 한국인 AI 페르소나

나와 비슷한 한국인은 어떻게 살까? 나이·성별·지역만 입력하면 주거·직업·소득을 통계로 분석해드려요.

내 페르소나 분석하기 →
← 블로그 목록으로
링크가 복사되었습니다!