이커머스 데이터 운영 실무 — RFM 세그먼트와 코호트 분석

RFM 분석은 고객을 최근성(Recency)·구매빈도(Frequency)·구매금액(Monetary) 세 축으로 점수화해 세그먼트로 나누는 기법이고, 코호트 분석은 같은 시기에 유입된 고객 집단(코호트)을 시간 축으로 추적해 잔존율과 재구매를 보는 기법입니다. 둘은 “지금 누가 우리 고객인가(RFM)”와 “그 고객들이 시간이 지나며 어떻게 남거나 떠나는가(코호트)”라는, 이커머스 데이터 운영의 두 핵심 질문에 답합니다. 전체 평균 매출 한 줄로는 절대 보이지 않는 이 구조를, 이 글은 정의·계산 단계·예시 표까지 실무자가 그대로 따라 할 수 있게 정리했습니다.

이 글의 모든 수치는 개념을 설명하기 위한 자체 계산 가상 예시이며, 실제 특정 기업 데이터가 아닙니다(표마다 “예시”로 표기). 개념 정의는 GA4 공식 문서와 업계 표준 자료로 확인했고, 별도 도구 없이 GA4와 스프레드시트만으로 시작하는 최소 버전까지 다룹니다. 성장은 “트래픽 양보다 매출이 될 1명”을 찾는 데이터 사이언스 관점에서 이 작업을 설계합니다.

왜 전체 평균은 거짓말을 할까요?

이커머스 대시보드에서 가장 자주 보는 지표가 “1인당 평균 구매액(ARPU)”입니다. 그런데 이 한 숫자는 종종 의사결정을 망칩니다. 평균은 극단값과 분포의 쏠림을 한 점으로 뭉개 버리기 때문입니다. 고객 매출은 거의 항상 소수 상위 고객에게 쏠린 비대칭 분포를 그리는데, 평균은 마치 “대표 고객”이 존재하는 것처럼 착시를 일으킵니다.

평균 고객에게 평균 메시지를 보내는 캠페인은 실제로 다른 고객 집단의 차이를 놓치게 됩니다.

가상의 이커머스 사례를 보겠습니다. 90일간 활동한 고객 1,000명, 총매출 1억 100만 원, 1인당 평균 매출은 약 11만 원입니다. 이 평균만 보면 “고객 한 명이 평균 11만 원을 쓴다”고 읽기 쉽습니다. 하지만 같은 데이터를 고객 그룹별로 쪼개면 전혀 다른 그림이 나옵니다.

고객 그룹 (예시)	고객 수(비중)	1인당 90일 매출	그룹 매출 비중
VIP	100명 (10%)	48만 원	43.6%
충성 고객	150명 (15%)	18만 원	24.5%
일반 고객	350명 (35%)	7만 원	22.3%
신규 고객	200명 (20%)	4.5만 원	8.2%
휴면 고객	200명 (20%)	0.8만 원	1.5%

전체 평균 11만 원에 실제로 들어맞는 고객은 거의 없습니다. VIP는 평균의 4.4배를 쓰고, 휴면 고객은 평균의 7%만 씁니다. 상위 10% VIP 한 그룹이 매출의 43.6%를, 상위 25%(VIP+충성)가 매출의 68.1%를 만듭니다. “평균 고객에게 평균적인 메시지를 보내는” 캠페인이 실패하는 이유가 여기 있습니다. 평균이라는 가상의 중간 고객은 존재하지 않고, 실제로는 성격이 완전히 다른 집단들이 섞여 있을 뿐입니다.

그래서 데이터 운영의 첫걸음은 “평균을 버리고 분포를 보는 것”입니다. 분포를 다루는 가장 검증된 두 가지 방법이 바로 RFM 세그먼트와 코호트 분석입니다. 이 관점은 광고 효율 지표를 다룰 때도 같습니다. 평균 ROAS의 함정에 관해서는 ROI와 ROAS의 함정 글에서 더 깊이 다룹니다.

RFM 분석 실무: 정의와 5분위 스코어링

RFM은 “최근에(Recency), 자주(Frequency), 많이(Monetary) 산 고객일수록 가치가 높다”는 단순하고 강력한 가설에서 출발합니다. RFM 분석은 고객의 가장 최근 구매·구매 빈도·구매 금액을 기준으로 고객 행동을 분석하는 세그먼테이션 기법입니다(Shopify, RFM Analysis 가이드).

지표	정의	측정 방식	의미
Recency (최근성)	마지막 구매 이후 경과 시간	오늘 − 마지막 구매일 (일 단위, 작을수록 좋음)	현재 인게이지먼트 수준
Frequency (빈도)	일정 기간 내 구매 횟수	주문 건수 합계 (많을수록 좋음)	충성도·습관화 정도
Monetary (금액)	일정 기간 내 총 구매 금액	구매액 합계 (많을수록 좋음)	매출 기여 크기

5분위(Quintile) 스코어링을 단계별로

RFM의 핵심은 세 지표를 절대값이 아니라 상대 순위 점수로 바꾸는 것입니다. 각 지표를 1~5점으로 평가하며 5가 각 항목에서 가장 가치 높은 고객을 뜻합니다(Shopify). 가장 널리 쓰는 방법이 고객을 5등분하는 5분위 스코어링입니다. 절차는 다음과 같습니다.

분석 기간과 기준일을 고정합니다. 예: 최근 12개월, 기준일은 데이터 추출일. 모든 고객의 Recency·Frequency·Monetary를 같은 기준으로 계산합니다.
고객별 원시값을 구합니다. 고객 1인당 마지막 구매 경과일(R), 주문 건수(F), 총 구매액(M)을 산출합니다.
각 지표를 5등분해 점수를 매깁니다. 고객을 값 순으로 정렬한 뒤 상위 20%씩 잘라 5~1점을 부여합니다. Recency는 경과일이 짧을수록 5점(방향 반대), Frequency·Monetary는 값이 클수록 5점입니다.
세 점수를 묶어 RFM 코드를 만듭니다. 예: R5·F4·M5 → “545”. 코드 자체로 고객 성격을 읽을 수 있습니다.

아래는 Recency 점수를 매기는 가상 예시입니다(고객 10명, 마지막 구매 경과일 기준). 경과일이 짧을수록 높은 점수를 받는다는 점이 핵심입니다.

마지막 구매 경과일 (예시)	3일	8일	14일	21일	30일	45일	60일	90일	150일	300일
Recency 점수	R5	R5	R4	R4	R3	R3	R2	R2	R1	R1

같은 방식으로 Frequency(주문 건수)와 Monetary(총 구매액)도 5등분하면, 모든 고객이 R·F·M 각 1~5점, 즉 5×5×5 = 125개 조합 중 하나에 배정됩니다. 분위 경계를 5등분 대신 비즈니스 기준(예: M은 “10만 원 미만/이상”)으로 직접 정해도 됩니다. 중요한 것은 모든 고객에게 동일한 규칙을 적용해 상대 위치를 일관되게 만드는 것입니다.

RFM 세그먼트 9종과 세그먼트별 액션

125개 조합을 그대로 쓰면 운영이 불가능합니다. 그래서 R·F·M 점수의 조합을 의미 있는 묶음으로 정리한 표준 세그먼트를 사용합니다. 업계에서는 흔히 RFM 점수 조합을 챔피언·충성·이탈위험 같은 이름의 그룹으로 묶어 각 그룹에 맞춤 캠페인을 연결합니다(Optimove, RFM Segmentation). 아래는 실무에서 가장 많이 쓰는 9종 세그먼트와 권장 액션입니다(점수 기준은 가상 예시이며, 비즈니스에 맞게 조정합니다).

세그먼트	RFM 특징 (예시 기준)	고객 의미	권장 액션
VIP / 챔피언	R5, F4~5, M4~5	최근·자주·많이 구매하는 최우량	VIP 전용 혜택·신상품 선공개·리뷰/추천 요청. 할인보다 인정과 경험.
충성 고객	R3~5, F4~5, M3~4	자주 사지만 객단가는 중간	업셀·세트 추천으로 객단가 상승, 멤버십·적립 강화.
잠재 충성	R4~5, F2~3, M2~3	최근 구매 활발, 빈도는 아직 낮음	2차 구매 유도 쿠폰·정기구독 제안으로 습관화.
신규 고객	R5, F1, M1~3	최근 첫 구매, 이력 짧음	온보딩 시퀀스·사용법 콘텐츠로 첫 재구매까지 안내.
유망 고객	R4, F1, M1	최근 유입, 저관여	브랜드 스토리·후기 노출로 신뢰 형성.
관심 필요	R3, F2~3, M2~3	활동이 둔화되기 시작	맞춤 추천·리마인드로 재방문 유도.
이탈 위험	R2, F3~4, M3~4	과거 우량이나 최근 뜸함	한정 혜택·재입고 알림으로 복귀 트리거.
놓치면 안 되는 고객	R1, F4~5, M4~5	과거 최우량인데 오래 이탈	강한 윈백 오퍼·1:1 컨택. 가장 우선순위 높은 회복 대상.
휴면 / 이탈	R1, F1~2, M1~2	오래전 소액 구매 후 단절	저비용 재활성 캠페인 1~2회, 미반응 시 발송 제외.

이 표가 강력한 이유는 같은 마케팅 비용을 전혀 다르게 배분하게 만들기 때문입니다. “놓치면 안 되는 고객”은 과거에 많이 썼던 고객이라 회복 시 가치가 크므로 가장 공격적으로 잡아야 하고, “휴면” 고객에게는 비용을 최소화해야 합니다. 모두에게 같은 할인 쿠폰을 뿌리는 대신, 세그먼트별로 메시지·혜택·채널을 다르게 가져가는 것이 RFM의 실전 효용입니다. 이는 고객을 단계별로 이해하는 고객 의사결정 여정(CDJ) 관점과 정확히 맞물립니다.

코호트 분석 실무: 잔존 테이블 읽는 법

RFM이 “지금 시점의 단면”이라면, 코호트 분석은 “시간에 따른 변화”를 봅니다. 코호트(cohort)는 공통된 특성을 공유하는 사용자 집단으로, GA4에서는 보통 동일한 획득 날짜를 가진 사용자들이 같은 코호트에 속합니다(GA4 공식 문서, Cohort exploration). 즉 “2026년 1월에 처음 구매한 고객”을 하나의 코호트로 묶고, 이들이 2월·3월·4월에 얼마나 다시 구매하는지를 추적합니다.

아래는 월별 가입(첫 구매) 코호트의 잔존 테이블 가상 예시입니다. M0는 가입 당월(=100%), M1·M2·M3는 가입 후 1·2·3개월 차에 다시 구매한 비율입니다. GA4 코호트 탐색에서 표의 각 셀은 시작일 이후 복귀 조건을 충족한 사용자 수를 보여줍니다(GA4 공식 문서).

가입 코호트 (예시)	M0	M1	M2	M3
1월 가입 (1,000명)	100%	22%	15%	12%
2월 가입 (1,200명)	100%	25%	18%	14%
3월 가입 (1,500명)	100%	31%	23%	—
4월 가입 (1,400명)	100%	34%	—	—

이 표를 읽는 법은 두 방향입니다.

가로(한 코호트의 시간 흐름): 1월 코호트는 100% → 22% → 15% → 12%로, 첫 달에 급감한 뒤 평탄해집니다. 이 “급감 후 안정화” 곡선이 정상이며, 평탄 구간의 높이가 핵심 단골층의 크기입니다.
세로(코호트 간 비교): M1 잔존이 1월 22% → 2월 25% → 3월 31% → 4월 34%로 꾸준히 오릅니다. 신규 코호트일수록 첫 달 재구매가 좋아진다는 뜻으로, 그 사이 도입한 온보딩·재구매 유도 시책이 효과를 냈다고 해석할 수 있습니다.

세로 비교가 특히 중요합니다. 전체 재구매율 한 숫자는 신규 유입 규모에 희석되어 개선을 가려 버리지만, 코호트로 끊어 보면 “언제 들어온 고객부터 좋아졌는가”가 드러납니다. GA4의 유지(Retention) 보고서도 같은 원리로, 사용자가 획득 후 첫 42일간 며칠에 한 번씩 돌아오는지를 보여 주며 첫날 100%에서 이탈에 따라 감소하는 곡선을 그립니다(GA4 공식 문서, 유지 개요 보고서).

재구매율 개선의 복리 효과는 얼마나 클까요?

잔존율을 몇 %p 올리는 일이 사소해 보일 수 있지만, 재구매는 매달 곱해지는 복리 구조라 누적 효과가 큽니다. 가상 예시로, 신규 1,000명 코호트가 추가 유입 없이 24개월간 만드는 누적 구매를 월 잔존율별로 계산해 보겠습니다(객단가 6만 원 가정).

재구매율은 매달 곱해지는 구조라 몇 %p의 개선도 LTV와 광고 효율을 크게 바꿉니다.

월 잔존율 (예시)	24개월 누적 구매건	고객당 기대 구매횟수	누적 매출
30%	약 1,429건	1.43회	약 8,571만 원
35%	약 1,538건	1.54회	약 9,231만 원
40%	약 1,667건	1.67회	약 1억 원

월 잔존율을 30%에서 40%로 10%p 올리면, 같은 신규 고객 1,000명에서 나오는 누적 매출이 약 17% 늘어납니다. 고객당 기대 구매횟수는 등비급수 합으로 근사할 수 있는데, 월 잔존율을 r이라 하면 1/(1−r)입니다. r=0.3이면 1.43회, r=0.4면 1.67회로, 잔존율이 높아질수록 분모가 작아져 LTV가 가속적으로 커집니다. 신규 획득 비용은 그대로인데 잔존만으로 고객 생애가치가 17% 늘어난다면, 이는 광고비 효율(ROAS)을 같은 폭으로 끌어올린 것과 같은 효과입니다.

여기서 RFM과 코호트가 만납니다. 코호트로 “어느 시점부터 잔존이 나빠지는가”를 찾고, 그 시점의 고객을 RFM의 “이탈 위험” 세그먼트로 식별해 선제 캠페인을 거는 것이 데이터 운영의 정석입니다. 이렇게 실험과 측정으로 재구매율을 끌어올리는 접근은 그로스해킹의 AARRR 중 리텐션·레퍼럴 단계와 정확히 일치합니다.

도구 없이 시작하는 최소 버전: GA4 + 스프레드시트

전용 CDP나 BI 도구가 없어도 두 분석 모두 오늘 시작할 수 있습니다. 핵심은 “거창한 인프라”가 아니라 “일관된 규칙으로 끊어 보는 습관”입니다.

분석	도구 없이 시작하는 최소 버전
코호트	GA4 탐색(Explore) → 코호트 탐색 템플릿 사용. 포함 조건을 “첫 구매(Any transaction)”, 복귀 조건을 “거래”로 설정하면 가입 월별 재구매 잔존 테이블이 바로 나옵니다. 측정기준·복귀 조건은 GA4 문서 기준으로 선택합니다(GA4 Cohort exploration).
RFM	주문 데이터(고객ID·주문일·주문액 3개 열)를 스프레드시트로 내보낸 뒤, 피벗으로 고객별 마지막 구매일·주문 수·합계액을 구합니다. 그다음 PERCENTRANK 또는 분위 경계로 R·F·M 1~5점을 매기고, 세 점수를 이어 붙여 세그먼트를 분류합니다.

주의할 점은 GA4 코호트는 사용자의 기기 데이터 기반이며 User-ID는 코호트 생성에 고려되지 않는다는 사실입니다(GA4 공식 문서). 따라서 로그인 기반 재구매를 정밀하게 보려면 결국 주문 DB 기반 RFM이 더 정확합니다. 두 도구의 신뢰도는 측정 세팅 품질에 직접 좌우되므로, 시작 전 이벤트·전환 추적이 제대로 설정됐는지부터 확인해야 합니다. 추적 세팅의 중요성은 추적툴 세팅이 중요한 이유에서 자세히 다룹니다.

세그먼트를 캠페인으로 연결하기 (CRM·이메일)

분석의 가치는 액션으로 연결될 때만 생깁니다. RFM 세그먼트와 코호트 신호는 그대로 CRM·이메일 자동화의 발송 조건이 됩니다. 분석 결과를 마케팅 채널로 흘려보내는 연결 구조를 예시로 정리하면 다음과 같습니다.

분석의 가치는 세그먼트별 행동 변화를 만드는 캠페인으로 연결될 때 생깁니다.

트리거 (세그먼트/신호)	채널	캠페인 예시	성공 지표
신규 고객 (R5·F1)	이메일/카카오 자동화	온보딩 3단계 시퀀스 → 첫 재구매 쿠폰	M1 잔존율
잠재 충성 (R4·F2~3)	이메일·앱 푸시	정기구독·세트 추천	구매 빈도(F) 상승
이탈 위험 (R2·F·M 高)	CRM 세그먼트 광고·이메일	한정 혜택·재입고 알림	복귀율·Recency 회복
놓치면 안 되는 고객 (R1·F·M 高)	이메일·1:1 컨택	강한 윈백 오퍼	윈백 전환·기여 매출
VIP (R5·F·M 高)	멤버십·전용 채널	신상품 선공개·리뷰 요청	유지율·추천(레퍼럴)

이때 성과는 “발송 건수”나 “오픈율”이 아니라 세그먼트의 행동 변화로 측정해야 합니다. 이탈 위험 캠페인의 성공은 메일을 몇 명이 열었느냐가 아니라, 그 코호트의 Recency가 실제로 회복됐는지·복귀 구매가 일어났는지로 판정합니다. 그리고 모든 세그먼트 캠페인은 작게 시작해 A/B로 검증하며 키우는 것이 안전합니다. 캠페인을 꾸준히 개선하는 실험 설계는 A/B 테스트로 광고 성과를 개선하는 방법에서 다룹니다.

이커머스 채널 운영, 특히 광고 단의 자동화(예: 메타 ASC 같은 머신러닝 캠페인)와 이 데이터 세그먼트를 연동하면, “누구에게 얼마를 쓸지”를 데이터로 정할 수 있습니다. 광고 자동화의 작동 원리는 메타 ASC 캠페인 가이드에서 확인할 수 있습니다.

데이터로 ‘매출이 될 1명’을 찾는 운영을 함께합니다

성장의 퍼포먼스 마케팅 팀은 RFM 세그먼트와 코호트 분석을 광고·CRM·이메일 운영에 직접 연결해, 트래픽 양이 아니라 실제 재구매와 LTV로 성과를 측정하는 데이터 운영 체계를 설계합니다. 평균에 가려진 ‘매출이 될 1명’을 찾는 작업을 함께하실 분은 퍼포먼스 마케팅 서비스를 살펴보시고, 우리 데이터 상황에 맞는 진단이 필요하시면 상담 문의로 연락 주십시오.

RFM과 코호트 분석은 고객을 나누는 데서 끝나지 않고 매출 가능성이 높은 고객에게 맞는 실행으로 이어져야 합니다.

이 주제의 전체 그림은 「이커머스 마케팅 전략 가이드 — 풀퍼널·데이터·플랫폼」에서 한눈에 보실 수 있습니다.

자주 묻는 질문 (FAQ)

RFM 분석과 코호트 분석은 무엇이 다른가요?

RFM은 “지금 이 시점에 누가 어떤 고객인가”를 최근성·빈도·금액 점수로 분류하는 단면(snapshot) 분석이고, 코호트는 “같은 시기에 들어온 고객 집단이 시간이 지나며 어떻게 남거나 떠나는가”를 보는 시계열 분석입니다. RFM으로 대상을 고르고, 코호트로 그 대상의 잔존 변화를 추적하는 식으로 함께 쓰면 가장 강력합니다.

RFM 점수는 꼭 5분위(1~5점)로 매겨야 하나요?

아닙니다. 5분위가 가장 보편적이고 균형 잡힌 방법이지만, 고객 수가 적거나 분포가 특이하면 3분위로 단순화하거나, 분위 대신 비즈니스 기준(예: 금액 10만 원 미만/이상)으로 경계를 직접 정해도 됩니다. 핵심은 점수 체계 자체가 아니라 모든 고객에게 동일한 규칙을 일관되게 적용해 상대 위치를 비교 가능하게 만드는 것입니다.

코호트 잔존 테이블에서 가장 먼저 봐야 할 지표는 무엇인가요?

두 가지입니다. 첫째는 가로 방향의 “급감 후 안정화” 여부로, 첫 달 이후 곡선이 평탄해지는 높이가 핵심 단골층의 크기입니다. 둘째는 세로 방향의 코호트 간 M1(첫 달) 잔존율 추이로, 신규 코호트일수록 이 값이 오르고 있다면 최근 도입한 재구매 시책이 효과를 내고 있다는 신호입니다. 전체 평균 재구매율은 신규 유입에 희석되므로 코호트로 끊어 보는 것이 정확합니다.

전용 분석 도구 없이 GA4와 스프레드시트만으로도 가능한가요?

가능합니다. 코호트는 GA4 탐색의 코호트 탐색 템플릿에서 포함 조건을 “첫 구매”, 복귀 조건을 “거래”로 설정하면 바로 잔존 테이블을 얻습니다. RFM은 주문 데이터(고객ID·주문일·주문액)를 스프레드시트로 내보내 피벗과 분위 함수로 점수화하면 됩니다. 다만 두 분석 모두 결과 신뢰도가 이벤트·전환 추적 세팅 품질에 좌우되므로, 시작 전 측정 세팅 점검이 선행되어야 합니다.

이커머스 데이터 운영 실무 — RFM 세그먼트와 코호트 분석

왜 전체 평균은 거짓말을 할까요?