fb-pixel
디지털 마케팅에서의 합성 데이터의 활용

디지털 마케팅에서의 합성 데이터의 활용

작가
Javier Marin
게재일
2025.02.24
예상 소요시간
10분
🌐
MIX Global Insight는
인사이트가 돋보이는 해외 콘텐츠를 원작자의 허락을 받고 번역 및 게시하고 있습니다.
더 깊은 이해를 위해 원문도 함께 읽어보시길 권장드립니다.


👏 400 🗨️ 3
written by Javier Marin
통계, 머신러닝/인공지능, 데이터, 관리, 전략. 모든 견해는 나의 자체 연구에 기반합니다.
Stats, ML/AI, data, management, strategy. All views are my own applied research.

브랜드와 마케팅 에이전시를 위한 새로운 기회

디지털 마케팅은 빠르게 변화하는 환경 속에서 끊임없이 새로운 전략을 요구합니다. 하지만 모든 브랜드가 충분한 데이터를 보유하고 있는 것은 아닙니다. 특히 신생 브랜드나 특정 캠페인의 경우, 수집된 데이터의 양이 적어 광고 효과를 정확히 분석하기 어렵습니다. 이런 상황에서 합성 데이터(Synthetic Data)가 중요한 해결책이 될 수 있습니다.

디지털 마케팅의 도전 과제

디지털 마케팅에서 가장 큰 고민은 어떤 광고 채널에 예산을 투자해야 할지를 결정하는 것입니다.
광고 예산을 효과적으로 배분하려면 데이터를 기반으로 의사 결정을 내려야 하지만, 모든 브랜드가 방대한 데이터를 보유하고 있는 것은 아닙니다.
새로운 캠페인을 시작할 때, 과거 데이터가 부족하면 미래 성과를 예측하기 어렵습니다.
마케터들은 끊임없이 새로운 콘텐츠를 만들고, 프라이버시 정책을 고려하며, 다양한 광고 채널을 관리해야 합니다. 그러나 데이터가 부족하거나 통계적으로 신뢰할 수 없는 경우, 정확한 마케팅 전략을 세우는 것이 쉽지 않습니다.
이럴 때 합성 데이터를 활용하면 부족한 데이터를 보완하고, 더 나은 의사 결정을 내릴 수 있습니다.

합성 데이터란 무엇인가?

최근 AI 기술이 발전하면서 이미지 생성 AI(예: DALL-E)나 텍스트 생성 AI(예: ChatGPT)에 대한 관심이 높아지고 있습니다. 하지만 마케팅 데이터는 일반적인 이미지나 텍스트와 다릅니다.
특히 표 형식 데이터(Tabular Data)는 다루기가 쉽지 않습니다.
표 형식 데이터는 고객 행동, 광고 성과, 매출 데이터처럼 수치화된 데이터입니다.
표 형식 데이터는 이미지나 텍스트 데이터만큼 발전하지 못했습니다.
우리는 모두 사진을 더 선명하게 보정하는 방법을 알고 있습니다. 이미지 처리 기술을 활용하면 원본 이미지에서 명확하지 않은 세부 사항을 더 잘 식별할 수 있도록 해상도를 향상할 수 있습니다. 이렇게 개선된 이미지는 원본 이미지에서 생성된 "합성 데이터 세트"라고 볼 수도 있습니다. 그렇다면 표 형식 데이터도 개선할 수 있을까요? 데이터의 "해상도"를 높여 더 많은 세부 정보를 볼 수 있을까요?
정답은 "예"이지만, 이미지의 경우처럼 직관적으로 이해하기 쉽지는 않습니다.
최근 AI 기술이 발전하면서 이미지 생성 AI(예: DALL-E)나 텍스트 생성 AI(예: ChatGPT)에 대한 관심이 높아지고 있습니다. 하지만 마케팅 데이터는 일반적인 이미지나 텍스트와 다릅니다.
그러나 최근에는 GAN(Generative Adversarial Networks, 생성적 적대 신경망) 기술을 활용하여 실제 데이터와 유사한 합성 데이터를 생성할 수 있게 되었습니다.

GAN(생성적 적대 신경망)이란?

GAN은 두 개의 AI 모델이 경쟁하면서 점점 더 정교한 데이터를 만들어 내는 기술입니다.
그림 1: GAN 네트워크 개요. 이미지 출처: 저자 제공.
그림 1: GAN 네트워크 개요. 이미지 출처: 저자 제공.
첫 번째 AI(생성자, Generator)는 새로운 데이터를 생성합니다.
두 번째 AI(판별자, Discriminator)는 생성된 데이터가 실제 데이터와 유사한지 판별합니다.
이 과정이 반복되면서 실제 데이터와 매우 유사한 합성 데이터가 생성됩니다.
이 기술을 활용하면 마케팅에서 부족한 데이터를 보완할 수 있습니다. 예를 들어, 단기간의 광고 데이터만 있다면, 이를 기반으로 더 많은 데이터를 생성하여 분석의 신뢰도를 높일 수 있습니다.
* GAN에 대한 자세한 내용은, 우리가 이번 연구에서 사용할 파이썬 오픈소스 라이브러리를 소개하는 이 기사에서 확인할 수 있습니다.

포화점(Saturation Point)과 합성 데이터의 활용

마케팅에서 광고 예산을 결정할 때 중요한 개념 중 하나가 포화점(Saturation Point)입니다.
그림 2. 고센의 첫 번째 한계 효용 법칙(Gossen’s first law of marginal utility). 이미지 출처: 저자 제공.
그림 2. 고센의 첫 번째 한계 효용 법칙(Gossen’s first law of marginal utility). 이미지 출처: 저자 제공.

포화점이란?

광고 예산을 늘리면 초기에는 매출이 증가합니다.
하지만 어느 순간부터 광고비를 더 써도 매출 증가율이 둔화됩니다.
이 시점이 바로 포화점입니다.
포화점을 정확히 파악하지 못하면 불필요한 광고비 지출이 발생할 수 있습니다.
예를 들어, 이미 포화점에 도달했는데도 광고 예산을 계속 늘리면?
매출은 거의 증가하지 않는데, 광고비만 낭비됩니다.

포화점을 찾는 방법

포화점을 분석하려면 충분한 데이터가 필요합니다. 하지만 대부분의 브랜드는 데이터를 많이 보유하고 있지 않습니다.
데이터를 충분히 확보하지 못하면 포화점을 정확히 찾기 어려울 수 있습니다.
이때 합성 데이터를 활용하면 부족한 데이터를 보완하여 보다 정교한 분석이 가능합니다.

실전 사례

우리는 2년 전에 론칭한 신생 브랜드와 접촉했습니다. 이 브랜드는 그동안 여러 캠페인(예: Google, Facebook, LinkedIn 등)에 투자해 왔으며, 수집된 데이터가 한정적인 상황에서 광고 전략을 개선할 수 있도록 도움을 요청했습니다. 그들이 진행한 가장 비용이 많이 든 캠페인의 전반적인 결과는 다음 표(그림 3)와 같습니다.
그림 3. 브랜드의 첫 2년간 운영 결과 데이터 표. 이미지 출처: 저자 제공.
그림 3. 브랜드의 첫 2년간 운영 결과 데이터 표. 이미지 출처: 저자 제공.
이 표는 네 개의 열과 열아홉 개의 행(운영된 개월 수)을 포함하고 있습니다. 그들은 현재 포화점에 도달했는지를 파악하고, 이를 바탕으로 다음 전략적 단계를 계획하고자 합니다. 그림 4에서는 '총 효용(total utility)', 즉 월 반복 수익(MRR, Monthly Recurring Revenue)과 '광고 지출량'의 관계를 도식화한 결과를 확인할 수 있습니다.
그림 4. 브랜드가 수집한 원본 데이터. 이미지 출처: 저자 제공.
그림 4. 브랜드가 수집한 원본 데이터. 이미지 출처: 저자 제공.
우리는 이 데이터를 기반으로 포화점을 계산해야 하지만, 그래프를 보면 그것이 쉽지 않다는 것을 알 수 있습니다. 샘플 개수가 적어 여러 가지 방법으로 곡선을 그릴 수 있으며, 계절성(월별 영향)의 영향도 크기 때문입니다. 이러한 문제를 해결하기 위해 합성 데이터가 도움이 될 수 있는지 탐색해 보려 합니다.

결과

우리는 원본 19개의 샘플 데이터에서 2,000개 샘플의 합성 데이터 세트를 생성했습니다. 생성 코드 링크는 여기(링크)에서 확인할 수 있습니다. 그림 5에서는 원본 데이터와 합성 데이터의 비교 결과를 볼 수 있습니다.
그림 5. 원본 데이터와 합성 데이터 비교. 이미지 출처: 저자 제공.
그림 5. 원본 데이터와 합성 데이터 비교. 이미지 출처: 저자 제공.
합성 데이터가 실제 데이터를 대체할 수 있을지 판단하려면, 데이터가 "유사한지" 여부를 평가해야 합니다. 하지만 표 형식 합성 데이터를 다룰 때는 이 과정이 간단하지 않습니다.
(*유사성을 평가하는 방법에 대한 더 자세한 내용 원문을 참고해 주세요)

결론

많은 브랜드와 에이전시는 새로운 캠페인을 준비할 때 공통적으로 데이터 부족 문제를 겪습니다.
그들은 수집된 데이터를 기반으로 의사 결정을 내리고 싶어 하지만, 기존 데이터만으로는 충분한 인사이트를 도출하기 어려운 경우가 많습니다.
이 때, 합성 데이터를 활용하면 기존 데이터의 가치를 극대화할 수 있습니다.
실험에 사용된 코드 및 추가 자료는 GitHub에서 확인할 수 있습니다. 🚀

이 콘텐츠, 재미있게 보셨나요?
믹스의 글로벌 인사이트 시리즈는 계속됩니다.
믹스 확장 프로그램을 추가하시면, 새 콘텐츠 소식을 가장 먼저 받아보실 수 있어요.
댓글 0
댓글을 불러오는 중...