Skip links
GA4

GA4 데이터가 누락되었나요? 이걸 확인해봅시다 !

안녕하세요 연구소 데이터분석팀 엄태영PM 입니다.
오늘은 색다른 제목으로 눈길을 끌어보았는데요, 생각보다 중요한 내용이다보니 반드시 끝까지 읽어봐주세요 🙂

우리는 GA4 데이터를 조회하다가 간혹 이런 의심을 하곤 합니다.

“혹시 뭔가 데이터가 누락되고 있는게 아닐까 ?!”  라고 말이죠. 

바로 이런 경우 저희가 의심해봐야하는 부분이 바로 “데이터 기준점” 입니다.
특히 요즘 데이터분석팀에 문의주시는 내용 중에도 데이터 기준점으로 인해 생기는 문의가 상당히 많은 편인데요,
이 글을 끝까지 읽어보시고 GA4를 이해하고 사용하시는데 큰 도움이 되었으면 좋겠습니다.

자 그럼, 지금부터 데이터 기준점에 대해서 알아보도록 하겠습니다.

새로 설정한 데이터가 보여지지 않는 이유

GA4 운영 도중 혹시 기존에 보이던 데이터 항목들이 보이지 않게 되셨나요 ?
혹시 보고서에 아래와 같은 메시지가 나타나셨을까요 ?

데이터기준점

GA4에서는 구글 신호 데이터 활용과 동시에 개별 사용자들의 개인정보를 보호할 수 있도록 ‘데이터 기준점’을 적용합니다.

실제로 GA4에서 보고서와 탐색 메뉴를 통해 이런저런 데이터를 살펴보다 보면, 분명 문제없이 수집되고 있는 데이터가 보이지 않거나 누락되는 경우가 있습니다.

‘데이터 수집이 안되는 걸까? 유실되는 건가? 뭐가 잘못된 거지?’ 당황스러우셨던 분들도 있으실 텐데요. 이런 경우 ‘데이터 기준점’이 원인일 수 있습니다.

데이터 기준점이 적용될 경우 GA4 대시보드에서 위와 같이 기준점 적용됨이라는 경고 문구를 발견할 수 있습니다. 데이터 기준점은 웹사이트 방문자의 개인정보보호 차원에서 생겨난 GA4의 기능입니다.

데이터 기준점이 적용되면 특정 데이터를 보고서에서 볼 수 없게됩니다.
인구통계학, 관심사, 그리고 다른 구글 신호들에 의해서 구분된 사용자 하나하나의 정보를 볼 수 없게 하기 위해서 말입니다.

그렇다면, GA4 기준점은 언제 적용되나요?

공식 도움말에 따르면 Google 애널리틱스에서는 보고서를 통해 개별 사용자를 특정하지 못하도록 개인정보 보호를 위해 데이터 기준점을 적용하며, 다음과 같은 상황에서 적용됩니다.

구글 신호 데이터가 활성화 되어 있는 상태에서 설정한 해당 기간의 사용자 수가 적을 경우
구글 신호 데이터 활성화로 인해 보고서에 인구통계 정보가 포함되어 있을 때
보고 ID가 기기 ID 중심으로 작동하는 상태에서 총 사용자 수가 충분하지 않을 경우
해당 기간의 사용자 또는 이벤트 수가 적은 경우

즉 GA4에서 데이터를 볼 때 지정된 기간의 사용자 수가 적을 경우 개인정보보호를 위해 구글 애널리틱스가 자체적으로 보고서 또는 탐색 분석에서 규모가 작은 행을 숨기거나 삭제하여 데이터가 안보이는 것입니다.

데이터 기준점은 구글이 자체적으로 정의하여 적용하는 사항으로 GA4 사용자인 우리가 직접 조정할 수 있는 사항이 아닙니다.

그렇다면 이 기준점 적용으로 가려지는 수많은 ‘작은 볼륨의 보고서 데이터’를 확인할 방법은 없는 걸까요?

아예 방법이 없는 것은 아닙니다. 우리는 아래의 두 가지 방법을 활용해 데이터 기준점 적용을 막을 수 있습니다.

첫 번째 방법은 보고 ID(Reporting ID)를 기기 기반으로 설정하는 방법입니다.
보고 ID를 ‘기기 기반’으로 설정할 경우 구글 신호 데이터가 활용되지 않기 때문에 데이터 기준점이 적용되지 않습니다. 또한 보고 ID 방식 변경은 소급 적용이 가능하기 때문에 데이터 기준점 적용으로 보이지 않았던 데이터에 대한 분석이 필요할 경우 보고 ID 식별 방식을 일시적으로 변경하여 데이터를 확인한 후 다시 원래 설정으로 되돌려두는 방식으로 활용할 수 있습니다.(하지만 잦은 변경은 수집 환경에 좋지 않은 영향을 끼칠 수 있으므로 추천하지 않습니다.)
방법: Google 계정 관리 → 속성 → 보고ID → 모두보기 → 기기 기반

공식 도움말에 따르면 Google 애널리틱스에서는 보고서를 통해 개별 사용자를 특정하지 못하도록 개인정보 보호를 위해 데이터 기준점을 적용하며, 다음과 같은 상황에서 적용됩니다.

구글 신호 데이터가 활성화 되어 있는 상태에서 설정한 해당 기간의 사용자 수가 적을 경우
구글 신호 데이터 활성화로 인해 보고서에 인구통계 정보가 포함되어 있을 때
보고 ID가 기기 ID 중심으로 작동하는 상태에서 총 사용자 수가 충분하지 않을 경우
해당 기간의 사용자 또는 이벤트 수가 적은 경우

즉 GA4에서 데이터를 볼 때 지정된 기간의 사용자 수가 적을 경우 개인정보보호를 위해 구글 애널리틱스가 자체적으로 보고서 또는 탐색 분석에서 규모가 작은 행을 숨기거나 삭제하여 데이터가 안보이는 것입니다.

데이터 기준점은 구글이 자체적으로 정의하여 적용하는 사항으로 GA4 사용자인 우리가 직접 조정할 수 있는 사항이 아닙니다.

그렇다면 이 기준점 적용으로 가려지는 수많은 ‘작은 볼륨의 보고서 데이터’를 확인할 방법은 없는 걸까요?

아예 방법이 없는 것은 아닙니다. 우리는 아래의 두 가지 방법을 활용해 데이터 기준점 적용을 막을 수 있습니다.

첫 번째 방법은 보고 ID(Reporting ID)를 기기 기반으로 설정하는 방법입니다.
보고 ID를 ‘기기 기반’으로 설정할 경우 구글 신호 데이터가 활용되지 않기 때문에 데이터 기준점이 적용되지 않습니다. 또한 보고 ID 방식 변경은 소급 적용이 가능하기 때문에 데이터 기준점 적용으로 보이지 않았던 데이터에 대한 분석이 필요할 경우 보고 ID 식별 방식을 일시적으로 변경하여 데이터를 확인한 후 다시 원래 설정으로 되돌려두는 방식으로 활용할 수 있습니다.(하지만 잦은 변경은 수집 환경에 좋지 않은 영향을 끼칠 수 있으므로 추천하지 않습니다.)
방법: Google 계정 관리 → 속성 → 보고ID → 모두보기 → 기기 기반

두 번째 방법은 구글 신호 데이터 비활성화하는 방법입니다.
구글 신호 데이터는 수집을 비활성화할 경우 적용 이후 인구 통계 및 기타 추가 제공 데이터가 손실되고 소급 적용이 되지 않기 때문에 신중하게 진행해야 합니다.
방법 : Google 계정 관리 → 속성 → 데이터 설정 → 데이터 수집 → Google 신호 데이터 수집 OFF

구글신호데이터 비활성화

두 번째 방법은 구글 신호 데이터 비활성화하는 방법입니다.
구글 신호 데이터는 수집을 비활성화할 경우 적용 이후 인구 통계 및 기타 추가 제공 데이터가 손실되고 소급 적용이 되지 않기 때문에 신중하게 진행해야 합니다.
방법 : Google 계정 관리 → 속성 → 데이터 설정 → 데이터 수집 → Google 신호 데이터 수집 OFF

그렇다면 어떻게 해야 할까요?

정확한 사용자 식별을 포기할 것인가 VS 구글 신호 데이터 수집을 포기할 것인가

고민을 하게 되실 텐데요, 제가 권장하는 GA4 데이터 기준점 해결방법은 아래와 같습니다.

데이터기준점1

위 의사결정 모델과 아래의 질문들을 보시면 데이터 기준점 문제를 어떻게 해결하셔야 할지 파악할 수 있을 것입니다.

  • 데이터 기준점 없애는 것이 중요한가 ?
  • 구글에서 제공하는 인구통계 데이터가 필요한가 ?
  • 사용자 ID를 사용한 사용자 식별이 중요한가?

어떤 방법을 선택하시던 간에 진행하고 운영하고 계신 웹사이트 사용자 및 트래픽 분석이 이전보다 더 잘 진행되길 바랍니다.

혹시 위 내용에 계속해서 구글 신호 데이터가 나와서 당황하셨나요? 

이해를 돕기 위해서 구글 신호 데이터에 대해서도 간단하게 이해해봅시다 !

구글 신호 데이터란?

구글 신호 데이터는 명칭 그대로 ‘구글의 신호를 기반으로 한 데이터’로, 쉽게 설명하면 구글이 직접 수집한 다양한 사용자의 활동 데이터입니다.

사용자가 로그인한 상태로 Chrome, YouTube와 같은 특정 Google 서비스를 사용할 때 검색한 내용, 방문한 웹사이트, 시청한 동영상 등의 활동 정보를 Google 계정에 데이터로 저장하는 것입니다.

광고 개인 최적화 사용 = 구글 신호 데이터 수집 동의

구글 신호 데이터는 구글 계정에 로그인되어있고 동시에 ‘광고 개인 최적화’를 사용 설정한 사용자들에 한해서만 수집이 가능합니다.

또한, 구글은 ‘옵트 아웃(opt-out)’ 방식으로 우리의 활동 데이터를 수집 및 활용하고 있는데 이는 구글 계정을 생성하면 활동 데이터 수집 관련 항목들은 디폴트로 ‘활성화’ 되어 있고,

사용자가 이를 ‘사용 중지’할 경우에만 활용을 중단하는 선사용 후배제 방식을 뜻 합니다.

따라서, 우리가 구글 계정 관리 메뉴에서 직접 이 기능을 끄지 않았다면 우리는 이미 이 ‘광고 개인 최적화’를 사용하고 있을겁니다.

광고 개인 최적화 사용

구글 신호 데이터 활성화의 장점

GA4에서 구글 신호 데이터를 활성화하면 우리는 다음과 같이 더 많은 정보를 수집할 수 있습니다.

  1. 교차 플랫폼 보고
  2. 인구통계 및 관심분야
  3. GA4를 사용한 리마케팅
  4. 광고 보고 기능

웹사이트에 방문하는 사용자들을 각각의 사용자로 정확하게 인식할 수 있게 해주고, 사용자들의 인구통계 및 관심분야와 같은 추가 정보를 알 수 있으며, 이 정보들을 분석 및 광고에 다양하게 이용할 수 있게 된다는 것이죠.

예시 상황을 통해 좀 더 구체적으로 살펴보겠습니다.

1

연구소 데이터분석팀 엄태영PM은 구글 크롬 브라우저와 유튜브, Gmail 등의 구글 다양한 제품을 활용하기 위해 구글 계정을 보유하고 있으며, 가입 후 별도의 계정 설정을 변경하지 않았습니다.

그리고 스마트폰, 데스크톱, 랩톱, 태블릿 등 다양한 기기를 활용하고 있는 엄태영PM은 모든 기기에 자신의 구글 계정을 로그인해두었습니다.

2

키보드 구매를 고려하던 엄태영PM은 출근길에 스마트폰으로 키보드를 검색하던 중 삼성전자의 웹사이트를 방문합니다.

트리플하이엠 사무실에 도착한 엄태영PM은 근무 중에도 데스크톱으로 틈틈이 삼성전자의 웹사이트에서 다양한 제품을 탐색한 뒤, 퇴근하고 저녁 식사를 하며 태블릿으로 맘에 드는 제품을 비회원 결제했습니다.

(실제로 저는 근무 중에 쇼핑을 하진 않습니다ㅎ)

이때 웹사이트에 구글 애널리틱스가 설치되어 있고 구글 신호 데이터가 활성화되어 있다면, GA4에서 다음과 같이 활용이 가능합니다.

  • 엄태영PM이 삼성전자에 로그인하지 않았음에도 엄태영PM의 모든 교차 기기 활동을 GA4는 하나의 사용자로 인식하고 통합합니다.
  • 이를 통해 사용자가 스마트폰으로 제품을 탐색한 후 데스크톱 또는 태블릿으로 넘어가 구매를 완료하는 현상을 파악할 수 있습니다.
3
  • 교차 기기 사용 정보를 기반으로 광고 캠페인은 사용자의 행동/구매 패턴에 맞는 광고 상품과 교차 기기 리마케팅을 활용하여 광고 운영 및 예산 지출을 최적화합니다.
4
  • 엄태영PM과 같이 Google 계정에 로그인하고 광고 개인 최적화를 활성화한 상태로 웹사이트를 방문한 많은 유저들의 인구통계 및 관심분야에 대한 추가 정보를 알 수 있습니다.
5

하지만 구글 신호 데이터가 비활성화되어 있다면 아래와 같이 인구통계 및 관심분야 데이터가 제공되지 않습니다.

6 1

인구통계 및 관심분야 데이터는 구글신호데이터를 기반으로 수집된다는 것을 알 수 있습니다.

이처럼 구글 신호 데이터 활성화를 통해 얻을 수 있는 정보들 역시 GA4의 다른 속성과 동일하게 소급 적용이 되지 않기 때문에, 구글 신호 데이터 활성화 설정 이후 시점부터 데이터 수집이 시작됩니다.

이상으로 데이터기준점 과 구글신호데이터에 대해서 알아보았습니다.

감사합니다.

View
Drag