fb-pixel

마케팅 믹스 모델링에서 불확실성이 중요한 이유

작가
Javier Marin
게재일
2025.03.27
예상 소요시간
15분
🌐
MIX Global Insight는
인사이트가 돋보이는 해외 콘텐츠를 원작자의 허락을 받고 번역 및 게시하고 있습니다.
더 깊은 이해를 위해 원문도 함께 읽어보시길 권장드립니다.


🔗 원문 : A Story of Long Tails: Why Uncertainty in Marketing Mix Modelling is Important 본 글은 위 링크의 원문을 기반으로 하며, 믹스의 독자들을 위해 작가가 직접 내용을 재구성하고 편집한 것입니다.
This article is based on the original piece (link) and has been edited and adapted by the author for Mix readers.
written by Javier Marin
통계, 머신러닝/인공지능, 데이터, 관리, 전략. 모든 견해는 저의 자체 연구에 기반합니다.
Stats, ML/AI, data, management, strategy. All views are my own applied research.

“디테일이 중요하다. 제대로 하기 위해 기다릴 가치가 있다." — 스티브 잡스

가장 중요한 마케팅 인사이트가 우리가 흔히 ‘노이즈’나 ‘불확실성’이라며 지나치는 곳에 숨어 있다면 어떨까요?

마케팅 성과를 분석할 때 우리는 보통 ‘평균’에 집중합니다. 예를 들어, 유튜브나 네이버 광고의 평균 전환율이 2.5%라면, 그 수치를 기준으로 계획을 세우곤 하죠. 하지만 이런 방식은 진짜 중요한 부분을 놓칠 수 있습니다. 실제 마케팅 데이터는 항상 평균적으로 분포되지 않기 때문입니다. 오히려 결과는 평균보다 훨씬 좋은 경우나, 반대로 아주 낮은 경우가 섞인 ‘롱테일(long tail)’ 형태를 보이는 경우가 많습니다. 이런 특별한 값들은 단순한 오류가 아니라, 마케팅 전략을 바꿀 수 있는 중요한 힌트일 수 있습니다.

롱테일은 우리에게 어떤 이야기를 들려줄까요?

소셜 미디어 캠페인을 떠올려보세요. 어떤 게시물은 유난히 높은 반응을 얻고(헤드), 일부는 그럭저럭 괜찮은 반응을 얻으며(바디), 대부분은 거의 반응이 없습니다(테일). 이런 패턴은 단순히 운이 좋아서 생기는 게 아닙니다. 과학자들은 이를 ‘멱 법칙(Power Law)’이라 부르며, 자연과 사회 전반에서 흔히 나타나는 현상이라고 설명합니다. 예를 들어, 지진의 강도나 부의 분포도 비슷한 패턴을 보입니다. 마케팅도 마찬가지예요. 이런 분포는 마케팅 성과가 여러 요인이 얽혀 있는 복잡한 시스템에서 나온 결과라는 것을 의미합니다.
image block
그림 1. 이상적인 가우시안 분포와 롱테일. 저자 그림.
특정 채널에서 디지털 캠페인을 진행한다고 생각해봅시다. 어떤 게시물은 매우 큰 반응을 얻고, 많은 게시물은 그저 그런 반응을 얻으며, 대부분의 게시물은 거의 반응이 없습니다. 이 현상은 우연이 아닙니다. 실제로는 자연스럽고 반복적으로 나타나는 ‘스케일링 법칙’을 따릅니다. 그리고 이 안에는 중요한 인사이트가 담겨 있습니다.
기존의 마케팅 믹스 모델(MMM)은 이처럼 낮은 반응을 보이는 테일을 줄이고, 평균적인 성과에 더 집중합니다. 하지만 이 ‘테일’은 예측 가능한 패턴을 따르며, 오히려 마케팅 전략에 유용하게 활용될 수 있습니다. 그렇다면 이런 패턴은 왜 생기는 걸까요?

왜 롱테일은 패턴을 따를까?

모래더미를 천천히 쌓는 장면을 떠올려보세요. 처음엔 아무런 일이 일어나지 않다가, 어느 순간 모래 한 알이 전체 균형을 무너뜨리며 눈사태처럼 무너집니다. 이건 단순한 우연이 아닙니다. 과학자들은 이를 ‘자가 조직적 임계 상태(Self-Organized Criticality, SOC)’라고 부릅니다.
마케팅도 비슷합니다. 캠페인을 계속 쌓아가다 보면, 어느 순간 아주 작은 변화가 엄청난 반응을 불러올 수 있습니다. 갑자기 터지는 반응은 ‘이상한 예외’가 아니라, 시스템이 원래 그런 식으로 작동한다는 신호인 거죠.

모래더미에서 마케팅까지

소셜 미디어 게시물이 갑자기 입소문을 타거나, 어떤 캠페인이 특정 지역에서 큰 성과를 내는 경우를 본 적 있을 거예요. 이 역시 자연스러운 패턴입니다. 몇 가지 과학적 개념을 통해 이를 조금 더 설명해볼게요.
1) 자가 조직적 임계 상태(SOC)
마케팅은 시간이 지나며 자연스럽게 ‘티핑 포인트’를 향해 나아갑니다. 이 지점에서 작은 변화가 큰 반응으로 이어질 수 있습니다. 우리가 어떤 캠페인에서 갑자기 성과가 뛰어난 이유를 설명해주는 개념입니다.
2) 고도로 최적화된 허용성(Highly Optimized Tolerance, HOT)
성과가 좋은 마케팅 채널은 단순한 요소들의 조합이 아닙니다. 예를 들어 TV 광고는 창의성, 도달률, 반복 노출, 문화적 맥락 등 다양한 요소가 정교하게 맞물려 작동합니다. 이처럼 복잡한 요소들이 모여 하나의 오디언스를 효과적으로 사로잡습니다.
3) 퍼콜레이션(Percolation)
이 개념은 마케팅 메시지가 오디언스 네트워크를 통해 얼마나 잘 퍼지는지를 설명합니다. 성과가 낮은 캠페인은 반응이 흩어지지만, 성과가 높은 캠페인은 오디언스 사이를 효과적으로 연결하며 퍼져나갑니다. 요즘처럼 오디언스가 세분화된 시대에는 이 ‘연결성’이 더욱 중요합니다.
image block
1)
자가 조직적 임계 상태(SOC)의 기본 개념은, 복잡한 시스템이 스스로 임계점에 도달하도록 정리된다는 것입니다. 이 임계점은 두 가지 서로 다른 상태가 바뀌는 ‘경계선’이라고 볼 수 있어요. 그래서 이 현상은 ‘상전이(phase transition)’라고 불립니다.
예를 들어, 모래더미는 일정한 높이(임계점)까지는 계속 쌓이지만, 그 높이를 넘어서면 더 이상 쌓이지 않고 모래가 흘러내리기 시작합니다. 이때부터는 눈사태처럼 다른 방식으로 변화가 일어납니다.
저자 그림.
2)
세포의 구조와 기능은 HOT 메커니즘(고도로 최적화된 허용성)을 잘 보여주는 사례입니다.
세포는 핵과 같은 복잡한 구조를 가진 다양한 구성 요소들로 이루어져 있고, 각 요소는 자신만의 역할을 수행합니다. 이렇게 역할이 나뉘고 전문화되어 있기 때문에 세포는 외부 자극이나 위험에도 유연하게 대응하며, 튼튼하게 유지될 수 있습니다.
3)
퍼콜레이션(percolation)은 소비자 네트워크에서 제품이 어떻게 퍼지는지를 설명하는 개념입니다.
어떤 신제품이 나왔을 때, 사람들은 그 품질(Q)이 자신이 기대한 수준(q)보다 높을 때만 구매하려고 합니다. 이 조건을 만족하는 사람들(녹색 노드)은 제품을 구매할 수 있지만, 그렇지 않은 사람들(빈 노드)은 구매하지 않아요.
시간이 지나면서 구매 의사가 없는 소비자들과 그 주변 연결도 네트워크에서 빠지게 되고, 그 결과 남은 소비자들끼리 그룹(클러스터)을 형성하게 됩니다. 이 클러스터는 작을 수도 있고, 아주 클 수도 있습니다. 충분히 큰 클러스터가 형성되면, 이 소비자들은 마치 하나의 큰 집단처럼 비슷하게 행동하게 됩니다.
저자 그림.

이것이 당신의 마케팅 채널에 어떻게 적용되는가

이제 앞에서 이야기한 과학 개념들을 실제 마케팅에 어떻게 적용할 수 있는지 살펴볼 차례입니다. 먼저 질문 하나: 우리는 이런 인사이트를 어디서 얻을 수 있을까요? 그 답은 당신이 MMM(Marketing Mix Modeling)을 통해 만든 소비자 반응 곡선 안에 있습니다.
TV와 잡지 광고: 이런 전통적인 채널은 성과 차이가 큰 편입니다. 어떤 캠페인은 매우 잘 되지만, 어떤 건 별 반응이 없죠. 그 이유는 단순히 운이 없어서가 아니라, 이 채널들이 HOT 시스템처럼 작동하기 때문입니다. 이 말은 곧, 여러 가지 요소 — 예를 들면 창의적인 메시지, 문화와의 궁합, 도달 범위 같은 요소들이 복합적으로 잘 맞아떨어질 때 큰 효과를 낸다는 뜻입니다. 그래서 이 채널들은 파급력이 큰 대신 성과의 변동성도 크기 때문에 항상 주의 깊게 지켜봐야 합니다.
프로그램매틱 광고와 옥외 광고: 이런 채널은 비교적 단순합니다. 작동 방식이 예측 가능하고, 큰 성과도 큰 실패도 잘 없습니다. 쉽게 말해, 옷장에서 매일 꺼내 입는 기본템 같은 존재죠. 언제 써도 무난하고, 다양한 캠페인에 활용 가능하지만, 큰 반전이나 돌파구는 기대하기 어렵습니다.
소셜 미디어 캠페인: YouTube, Instagram, Facebook, 네이버, 카카오 등 다양한 플랫폼에서 벌어지는 캠페인은 어떤 건 대박이 나고, 어떤 건 묻히기도 하죠. 이럴 때는 퍼콜레이션 개념을 떠올려야 합니다. 성과가 좋은 캠페인은 오디언스 사이에 잘 연결된 흐름을 타고 퍼지지만, 성과가 낮은 캠페인은 흩어진 개인들에게 따로따로 닿을 뿐입니다. 연령, 관심사, 지역 등 다양한 기준으로 세분화하는 기능은 유용하지만, 전체 시장에 효과를 일반화하긴 어렵기 때문에 오디언스를 직접 통제하는 전략이 중요합니다.

마케팅 예산은 어떻게 나눠야 할까?

전체 예산의 40~50%는 TV나 잡지처럼 성과는 크지만 변동성도 큰 채널(HOT 메커니즘)에,
20~30%는 옥외 광고처럼 안정적인 성과를 내는 채널에,
10~20%는 실험적이지만 잠재력이 있는 새로운 채널에 투자하는 것이 좋습니다.
캠페인을 확장하기 전에는, 단순히 노출만 많아지는 게 아니라 진짜 영향력이 연결돼서 퍼지고 있는지를 확인해야 합니다. 또한, 채널이 임계점에 가까워졌는지도 체크해야 해요. 예를 들어 광고가 너무 자주 노출돼서 오히려 거부감을 주기 시작하는 시점 말이죠. 마지막으로 꼭 기억하세요: 마케팅 데이터 속의 ‘노이즈’는 무시해야 할 오류가 아니라, 그 채널이 실제로 어떻게 작동하는지를 보여주는 중요한 신호입니다.

실제 사례 실험

이러한 모든 개념들을 실제로 확인하고 싶다면, MMM 분석을 통해 그것들을 더 잘 이해할 수 있습니다. 저희는 유럽의 수도에 있는 한 패션 부티크의 광고 집행을 시뮬레이션한 더미 데이터를 사용했습니다. 이 데이터셋에는 다양한 채널 지출 정보(온라인과 오프라인 모두), 몇 가지 통제 변수, 그리고 KPI 항목이 포함되어 있습니다. MMM 분석을 위해 Python 라이브러리인 LightweightMMM을 사용하였습니다. 데이터셋에는 KPI(이 경우 ‘부티크 매출’)의 주간 데이터와 여러 광고 채널 및 통제 변수가 함께 포함되어 있습니다.
(미디어 외 정보) 이번 실험은 미디어 변수와 통제 변수를 모두 사용하여 수행하였지만, 여기서는 미디어 데이터에만 집중하여 설명드리겠습니다.
아래 그림은 모델 결과로 나타난 광고 채널별 영향력 분포를 보여줍니다. 분포의 뒷부분에 나타나는 롱테일은 일부 채널이 매우 큰 영향을 줄 가능성이 있다는 점을 나타내며, 실제로 높은 효과를 낼 수 있는 확률이 존재함을 보여줍니다. 예상한 것처럼, 이러한 불확실성은 좌우로 대칭적이지 않습니다. 아래는 베이지안 방식을 사용한 MMM 모델링 결과이며, 저희는 구글의 오픈소스 라이브러리인 LightweightMMM을 활용하였습니다. 그래프는 채널 영향력의 분포를 보여줍니다. 롱테일이 보이시나요?
image block
더미 데이터를 사용한 LightweightMMM 결과로 얻은 채널 영향력 분포. 저자 그림.
이제 우리가 필요한 정보의 일부를 얻었으니, MMM 모델에서 얻은 소비자 반응 곡선을 살펴봅시다.
image block
MMM과 더미 데이터를 활용해 얻은 소비자 반응 곡선. 저자 그림.
우리는 소비자 반응 데이터를 적합시키기 위해 특별한 공식을 사용하고 있습니다. 이 공식이 특별한 이유는 앞에서 설명한 고도로 최적화된 허용성 메커니즘(HOT), 자가 조직적 임계 시스템(SOC), 그리고 퍼콜레이션 메커니즘이 이 안에 포함되어 있기 때문입니다. 이 공식을 이용해 데이터를 분석하면서 얻는 파라미터들이 바로 우리가 가장 주목하는 핵심입니다.
image block
소비자 반응 데이터를 적합시키기 위해 사용된 특별한 공식
기본 기여도(C): 이 파라미터는 광고 캠페인이 전반적으로 어느 정도 효과를 내는지를 보여줍니다. 기본 기여도는 채널 영향력과는 다릅니다. 그 차이는 무엇일까요? 기본 기여도는 캠페인의 세부 기획(세분화, 메시지 구성, 창의성 등)이 얼마나 잘 되었는지와 관계없이, 채널 자체가 갖고 있는 기본적인 영향력을 의미합니다. 다시 말해, 채널의 잠재적인 영향력을 나타낸다고 볼 수 있습니다.
마케팅 민감도 지수(α): 'TV'와 '스폰서십'의 민감도 지수가 높게 나타난 것(각각 0.80584, 0.6618)은, 이 채널들에서 HOT 메커니즘처럼 여러 상호작용 요소들이 잘 정렬되어 있음을 보여줍니다. 이 지수는 시스템이 빠르게 확장될 수 있는 가능성을 반영합니다. 반대로, '브랜드 검색'처럼 α 값이 낮은 채널(0.0378)은 구조가 더 단순하고 집중되어 있으며, 성과는 더 예측 가능하지만 큰 확장을 기대하긴 어렵습니다.
반응 민감도(β): '애드버토리얼'과 '잡지'(각각 0.9518, 0.3270)는 SOC 메커니즘에 해당하는 급격한 반응 변화를 보여줍니다. 이 수치는 채널 반응에 여러 복잡한 요소가 함께 작용하고 있으며, 시스템이 HOT 상태에 가까운 것을 의미합니다. 반면, '비즈니스 이벤트'와 '스폰서십'처럼 β 값이 낮은 채널(0.0000, 0.0404)은 반응 변화가 훨씬 천천히 일어나며, 반응의 한계점이 명확하지 않다는 것을 뜻합니다.
행동 민감도 지수(γ): '파트너십'과 '브랜드 검색'의 γ 값이 높게 나타난 것(각각 1.0000, 0.9741)은 이 채널들이 큰 오디언스 그룹을 통해 광고 효과를 널리 퍼뜨릴 수 있음을 보여줍니다. 이는 영향력 분포의 비대칭적인 테일 구조와도 잘 맞아떨어지며, 효과적인 광고 네트워크 확산을 설명해 줍니다. 반대로 'TV'와 '스폰서십'(각각 0.0081, 0.0357)은 γ 값이 낮기 때문에, 네트워크 효과가 제한적이고, 보다 분산된 오디언스에 도달하고 있음을 나타냅니다. 이러한 결과는 그림 11에서 보이는 보다 균형 잡힌 영향력 분포와도 일치하며, 서로 다른 반응 메커니즘들이 함께 작동하고 있음을 설명합니다.

결론

마케팅을 복잡계의 관점으로 바라보는 것은 단순한 이론이 아니라, 실제 업무에 매우 도움이 되는 접근 방식입니다. 우리는 두 가지 방법으로 채널을 분석했습니다. 첫째는 분포 패턴 분석, 둘째는 반응 곡선 분석입니다. 두 분석 모두에서 같은 결론에 도달했습니다. 이 일관성은 단순한 우연이 아닙니다.
데이터는 우리에게 TV나 잡지 같은 채널에 예산의 40~50%를 투자하라고 말해줍니다. 그 이유는 이 채널들이 여러 요소가 함께 작동하는 강력한 시스템(HOT 메커니즘)이기 때문입니다. 이러한 채널은 다양한 오디언스에 도달할 수 있고, 여러 상황에 잘 적응하기 때문에 안정성과 돌파력을 모두 갖추고 있습니다.
흥미로운 점은, 수학적 모델이 이런 분석을 뒷받침해준다는 사실입니다. ‘롱테일’ 잠재력에 대한 통계적 측정 값은 마케팅 민감도 지수와 직접적으로 연결되어 있습니다. 쉽게 말하면, 가끔 뛰어난 성과를 보여주는 채널은 단순히 운이 좋은 것이 아니라, 본질적으로 큰 가능성을 가진 구조라는 뜻입니다.
결론은 명확합니다. 마케팅 성과의 변동성을 두려워하지 말고, 그 안에서 의미를 찾아야 합니다. 예측하기 어렵다고 느껴지는 채널일수록, 사실은 더 정교하고 강력한 전략 도구가 될 수 있습니다. 다양한 요소들이 제대로 정렬될 때, 그 채널은 예상 이상의 성과를 만들어낼 수 있습니다.

이 콘텐츠, 재미있게 보셨나요?
믹스의 글로벌 인사이트 시리즈는 계속됩니다.
믹스 확장 프로그램을 추가하시면, 새 콘텐츠 소식을 가장 먼저 받아보실 수 있어요.