GEO ROI 측정 — 5대 KPI와 경영진 보고 대시보드 설계

이 글은 성장(Growth)의 GEO 백서 시리즈 19/20 — Ch.13 ROI 측정입니다. 전체 목차와 PDF 전문은 백서 페이지에서 확인하실 수 있습니다.

GEO의 핵심 KPI는 Share of Answer(SoA), 즉 AI 답변 내 브랜드 인용 점유율입니다. AI 유입은 일반 검색 유입보다 전환 가치가 훨씬 높아(Semrush 분석 4.4배, Ahrefs 자체 데이터 23배) 매출 기여도에서는 트래픽 볼륨 이상의 가치를 갖습니다. 하지만 SoA만으로는 GEO(생성형 엔진 최적화) 성과의 전체 그림을 그릴 수 없습니다. 다섯 가지 KPI를 통해 입체적으로 측정해야 합니다.

GEO의 5대 KPI — 무엇을 측정해야 하는가

첫째, Share of Answer(답변 내 인용 점유율)입니다. 업계 핵심 질문 100개를 선정하고, 각 질문에 대해 주요 AI 엔진의 답변에서 우리 브랜드가 인용되는 비율을 추적합니다. 예를 들어 “B2B 마케팅 에이전시 추천”이라는 질문을 ChatGPT, Perplexity, Google AIO, 네이버 AI에 입력했을 때 10개 중 3개 답변에서 우리 브랜드가 언급되면 SoA는 30%입니다. 이것을 월간으로 추적하면 GEO 활동의 효과를 직접적으로 볼 수 있습니다.

GEO 성과는 트래픽보다 AI 답변 안에서 얼마나 자주, 어디서, 어떤 맥락으로 선택되는지를 봐야 합니다.

둘째, Engine Coverage(엔진 커버리지)입니다. 몇 개의 AI 엔진에서 우리 브랜드가 인용되는지를 측정합니다. SearchAtlas의 LLM 인용 행동 분석에서 세 주요 엔진이 같은 질문에 출처 도메인을 하나 이상 공유하는 경우는 쿼리의 60~65%에 그쳤고, 나머지 35~40%는 완전히 분리된 출처 집합을 인용했습니다. 특정 엔진에서만 인용되는 것과 다수의 엔진에서 인용되는 것은 도달 범위에서 큰 차이를 만듭니다. 단일 엔진 의존은 리스크입니다.

셋째, Sentiment Score(감성 점수)입니다. AI가 우리 브랜드를 인용할 때 긍정적으로 언급하는지, 중립적인지, 부정적인지를 분석합니다. 인용 자체도 중요하지만, “이 분야에서 신뢰할 수 있는 기업”으로 언급되는 것과 “논란이 있는 기업”으로 언급되는 것은 비즈니스 영향에서 하늘과 땅 차이입니다.

넷째, Citation Position(인용 위치)입니다. AI 답변 내에서 브랜드가 첫 번째로 언급되는지, 마지막에 언급되는지를 추적합니다. Liu et al.(2024)의 “Lost in the Middle” 연구가 보여주듯 언어모델은 입력 맥락의 처음과 끝에 있는 정보를 가장 잘 활용하고 중간의 정보는 놓치기 쉬우며, 답변을 읽는 사용자 역시 앞부분에 주의를 집중합니다. 인용 위치는 사용자 인지에 직접적으로 영향을 미칩니다.

다섯째, Causal Impact(인과적 기여도)입니다. GEO 활동과 비즈니스 성과(리드, 매출, 전환) 사이의 인과 관계를 통계적으로 검증합니다. 상관관계가 아닌 인과관계를 입증하기 위해 A/B 테스트나 시계열 분석 등의 방법론을 활용합니다.

이 KPI들을 일상에서 추적하는 AI 인용 추적 방법 4가지의 실무 절차는 GEO 측정 가이드가 정본으로 다루며, 측정이 전체 전략에서 차지하는 위치는 GEO 백서 전체 목차에서 한눈에 확인하실 수 있습니다.

AI 가시성 5차원 모델

CC-GSEO-Bench(Chen et al., 2025)의 다차원 평가 프레임워크를 실무 환경에 맞게 재구성한 5차원 모델을 제안합니다. 각 차원이 비즈니스에 어떤 의미를 갖는지 이해하면 측정의 우선순위가 명확해집니다.

AI 가시성은 인용의 양뿐 아니라 정확도, 맥락, 경쟁 위치, 전환까지 함께 측정해야 합니다.

인용 빈도(Citation Frequency)는 가장 기본적인 차원으로, AI 답변에서 우리 브랜드나 콘텐츠가 얼마나 자주 언급되는지를 측정합니다. 이것은 GEO의 “양적 지표”입니다. 인용 정확도(Citation Accuracy)는 AI가 우리 정보를 정확하게 인용하는지를 확인합니다. 잘못된 정보로 인용되면 오히려 브랜드에 해가 되므로, 빈도 못지않게 중요합니다. 인용 맥락(Citation Context)은 어떤 맥락에서 인용되는지를 봅니다. 긍정적 추천 맥락인지, 단순 나열인지, 비교 대상인지에 따라 비즈니스 가치가 달라집니다.

인용 경쟁력(Citation Competitiveness)은 같은 질문에 대해 경쟁사와 비교한 상대적 위치입니다. 절대적 인용 빈도보다 경쟁사 대비 상대적 위치가 마케팅 전략 수립에 더 유용한 정보를 제공합니다. 인용 전환(Citation Conversion)은 AI 인용이 실제 웹사이트 방문, 리드, 매출로 이어지는 비율입니다. Ahrefs의 자체 데이터에서 AI 검색 방문자의 전환율이 일반 검색 대비 23배 높게 나타난 것은 이 차원의 잠재력을 보여주며, Superlines의 통합 분석에서는 같은 브랜드라도 플랫폼 간 인용량에 최대 615배 차이가 존재한다는 점도 중요합니다. 이 다섯 차원을 각각 10점 척도로 측정하면 총 50점 만점의 AI 가시성 종합 점수를 산출할 수 있습니다.

GA4 AI 리퍼럴 분리 설정법

AI를 통해 유입되는 트래픽을 기존 오가닉 트래픽과 분리하여 측정하려면 GA4에서 별도의 채널 그룹을 설정해야 합니다. 핵심은 AI 엔진의 리퍼러(referrer) 도메인을 식별하는 정규식(regex)입니다.

GA4에서 AI 리퍼럴을 별도 채널로 분리하면 방문자 수와 전환을 오가닉과 구분해 볼 수 있습니다.

현재 주요 AI 리퍼러 도메인은 다음과 같습니다. ChatGPT(chat.openai.com, chatgpt.com), Perplexity(perplexity.ai), Claude(claude.ai), Google AI(gemini.google.com), Bing Copilot(copilot.microsoft.com). 이를 하나의 정규식으로 묶으면 (chat\.openai\.com|chatgpt\.com|perplexity\.ai|claude\.ai|gemini\.google\.com|copilot\.microsoft\.com) 형태가 됩니다. GA4의 관리자 설정에서 “채널 그룹”을 편집하여 “AI 검색” 채널을 신규 추가하고, 소스 조건에 이 정규식을 적용하면 AI 유입 트래픽이 별도의 채널로 분리되어 집계됩니다.

이 설정을 하면 비로소 “AI를 통해 몇 명이 방문했고, 그 중 몇 명이 전환했는가”를 정확히 추적할 수 있습니다. Previsible의 분석에서 AI 트래픽이 전체 세션의 0.13%에 불과하지만 ChatGPT 유입은 1년 새 최대 4.29배까지 성장했다는 트렌드를 우리 사이트에서도 확인할 수 있게 됩니다. 초기에는 절대 수치가 작더라도 성장 기울기를 추적하는 것이 중요합니다.

HDYHAU 설문 — 다크 퍼널 수치화

“How Did You Hear About Us(HDYHAU)”는 AI 시대에 특히 중요해진 설문 기법입니다. AI를 통해 브랜드를 알게 된 고객의 상당수는 직접 URL을 입력하거나 브랜드명을 검색하여 유입되므로, GA4 상에서는 “직접 유입(Direct)” 또는 “브랜드 검색”으로 잡힙니다. AI가 중개한 인지라는 사실이 데이터에 남지 않는 것입니다. 이것이 바로 AI 다크 퍼널이며, HDYHAU 설문은 이 다크 퍼널을 밝히는 유일한 도구입니다.

HDYHAU 설문은 GA4에 잡히지 않는 AI 추천과 브랜드 인지 기여도를 밝히는 보완 장치입니다.

설문 설계의 핵심은 간결함과 구체성입니다. “저희를 어떻게 알게 되셨나요?”라는 질문에 “ChatGPT / Perplexity 등 AI 검색에서 추천받았다”, “AI에게 질문했을 때 브랜드가 언급되었다” 같은 AI 관련 선택지를 명시적으로 포함해야 합니다. 그냥 “인터넷 검색”이라는 선택지만 있으면 AI 유입과 구글 검색 유입이 구분되지 않습니다. 이 설문을 문의 폼, 가입 페이지, 구매 후 설문에 삽입하면 분기별로 AI 인지 기여도를 수치화할 수 있습니다. G2의 2026년 조사에서 B2B 구매자의 51%가 AI에서 벤더 탐색을 시작한다는 데이터를 자사 데이터로 검증할 수 있는 기회입니다.

경영진 보고용 GEO 대시보드

경영진에게 GEO 성과를 보고할 때 가장 흔한 실수는 “데이터를 너무 많이 보여주는 것”입니다. 경영진이 보고 싶은 것은 세 가지뿐입니다. “잘 되고 있는가?”, “경쟁사 대비 어디에 있는가?”, “다음에 무엇을 해야 하는가?” 이 세 질문에 답하는 대시보드를 설계해야 합니다.

첫 번째 섹션은 GEO 핵심 지표 요약입니다. Share of Answer 추이(월간), AI 유입 트래픽 및 전환율, HDYHAU 설문 결과를 한 페이지에 담습니다. 두 번째 섹션은 경쟁사 비교입니다. 핵심 질문 10개에 대한 우리 vs 경쟁사 인용 현황을 시각화합니다. 세 번째 섹션은 이번 달 주요 성과 + 다음 달 계획입니다. 어떤 콘텐츠가 AI에 인용되었고, 어떤 활동이 성과를 냈으며, 다음 달에 무엇을 할 계획인지를 3~5개 불릿으로 요약합니다. 이 대시보드를 월 1회 제공하면 경영진이 GEO의 진행 상황을 일목요연하게 파악할 수 있고, 추가 예산 요청이나 전략 전환의 근거로 활용할 수 있습니다.

이 보고 체계가 실제로 작동하려면 브랜드마케팅·콘텐츠·홍보·IT가 측정 지표를 공유하는 협업 구조가 전제되어야 합니다. 부서별 역할 분담은 GEO 조직 설계 — 4팀 협업 모델과 RACI에서 다룹니다.

경영진 보고 대시보드는 핵심 지표 요약·경쟁사 비교·성과와 다음 계획의 3개 섹션이면 충분합니다.

AI 가시성 측정 도구 비교

현재 시장에는 다양한 AI 가시성 측정 도구가 등장하고 있습니다. 각 도구의 특성을 이해하고 자사 상황에 맞는 것을 선택해야 합니다.

AI 가시성 도구는 이름보다 측정할 KPI와 한국 시장 커버리지에 맞춰 선택해야 합니다.

AI 가시성 측정 시장은 아직 초기 단계이므로 각 도구의 기능과 커버리지가 빠르게 변하고 있습니다. 핵심 평가 기준은 세 가지입니다. 첫째, 모니터링 가능한 AI 엔진의 수입니다. ChatGPT만 측정하는 도구와 6개 이상의 엔진을 동시에 모니터링하는 도구는 가치가 다릅니다. 둘째, 한국어와 네이버 커버리지입니다. 한국 시장에서는 네이버 AI 브리핑까지 추적할 수 있는지가 중요한 변수입니다. 셋째, 경쟁사 비교 기능입니다. 절대적 수치보다 상대적 위치가 전략적 의미를 갖기 때문입니다.

도구	주요 기능	지원 엔진	가격대
Otterly.AI	프롬프트 단위 SoA 추적, 브랜드 멘션·인용 모니터링, 경쟁사 비교	ChatGPT, Perplexity, Google AIO·AI Mode, Gemini, Copilot	저~중
Profound	엔터프라이즈급 AI 가시성·인용 패턴 분석	ChatGPT, Google AIO·AI Mode, Gemini, Perplexity, Claude, Grok 등 10개	고
Peec AI	프롬프트 추적, 경쟁사 벤치마킹	ChatGPT, Perplexity, Google AIO 기본 + 엔진별 추가 옵션	중
Semrush (AI 모듈)	기존 SEO 데이터 + AI 가시성 통합	Google AIO, ChatGPT 등 주요 엔진	고
SE Ranking (AI 가시성 트래커)	AI 답변 내 브랜드 노출 추적 + SEO 통합	ChatGPT, Google AI 표면 중심	중

주의할 점이 있습니다. 위 표의 글로벌 도구들은 네이버 AI 브리핑을 기본 커버리지에 포함하지 않는 경우가 대부분이므로, 한국 시장 비중이 크다면 네이버 추적 가능 여부를 도입 전에 직접 확인해야 합니다. 그리고 도구 선택보다 중요한 것은 “무엇을 측정할 것인지”를 먼저 정하는 것입니다. 5대 KPI 중 자사에 가장 중요한 2~3개를 선정하고, 그것을 가장 잘 측정할 수 있는 도구를 선택하는 것이 올바른 순서입니다.

Key Takeaway

SoA(Share of Answer)가 GEO 핵심 KPI이며, Engine Coverage, Sentiment, Citation Position, Causal Impact와 함께 5대 지표 체계 구축
GA4에서 AI 리퍼럴 트래픽을 분리 설정하면 AI 유입의 양과 전환을 정확히 추적 가능
HDYHAU 설문으로 AI 다크 퍼널을 수치화하여 GA4에 잡히지 않는 AI 인지 기여도를 밝힘
경영진 보고 대시보드는 “잘 되고 있는가 / 경쟁사 대비 위치 / 다음 액션” 3가지에 집중

우리 브랜드가 지금 AI의 답변에 어떻게 등장하는지 궁금하시다면, AI 답변 점유율 진단을 문의해 주세요. GEO 백서 PDF 전문도 받아보실 수 있습니다.

자주 묻는 질문 (FAQ)

GEO 성과 측정의 핵심 KPI는 무엇인가요?

Share of Answer(SoA), 즉 업계 핵심 질문에 대한 AI 답변에서 우리 브랜드가 인용되는 점유율입니다. 여기에 Engine Coverage, Sentiment Score, Citation Position, Causal Impact를 더한 5대 KPI로 입체적으로 측정합니다.

업계 핵심 질문 100개를 선정하고 ChatGPT, Perplexity, Google AIO, 네이버 AI 등 주요 엔진에 입력해 브랜드가 인용된 답변의 비율을 구합니다. 10개 답변 중 3개에서 언급되면 SoA는 30%이며, 월간으로 추적해 추세를 확인합니다.

GA4에서 AI 유입 트래픽은 어떻게 분리하나요?

GA4 관리자 설정의 채널 그룹에서 “AI 검색” 채널을 신규 추가하고, 소스 조건에 chatgpt.com, perplexity.ai, claude.ai, gemini.google.com, copilot.microsoft.com 등 AI 리퍼러 도메인을 묶은 정규식을 적용합니다. 이후 AI 유입이 별도 채널로 집계됩니다.

GA4에 잡히지 않는 AI 인지 기여도는 어떻게 측정하나요?

HDYHAU(“저희를 어떻게 알게 되셨나요?”) 설문에 AI 검색 관련 선택지를 명시적으로 포함하고 문의 폼·가입 페이지·구매 후 설문에 삽입합니다. 분기별로 집계하면 직접 유입이나 브랜드 검색 뒤에 숨은 AI 다크 퍼널 기여도를 수치화할 수 있습니다.

GEO 백서 시리즈: ← 이전 챕터 · 전체 목차 · 다음 챕터 →