제목
GA4 샘플링/ 기준점 적용 관련 문의
작성자
곰이되고싶어요
작성일
2022-07-29 10:57
조회
1820
답변완료
안녕하세요. Ratel님.

제가 운영하는 서비스는 특정 앱 내의 회원 가입 화면을 제공하고 있습니다.

그러다보니 제가 제공하는 화면 전 후로 저희의 고객사 앱 화면이 포함되어 있습니다.

해당 앱에서는 Firebase를 통해 GA4로 데이터를 집계하고 있고 저희 서비스 화면은 GA4로 웹화면 데이터를 집계하고 있습니다.

고객 Funnel을 면밀 하게 분석하기 위해서는 해당 앱 서비스 화면에 대한 이해가 필요하여,

해당 앱의 데이터와 저희 서비스의 데이터를 연계해서 분석하고 있는데요. 이 과정에 애로 사항이 있어, 문의 드립니다.

1. 샘플링 기준 관련 문의

고객사 앱의 경우 저희 서비스 보다 트래픽 양이 훨씬 많습니다. 그래서 인지 리포트 조회를 해보면 0.76% 수준으로 샘플링 되었다고 노출이 됩니다. 반면에 저희 서비스 화면은 샘플링 되지 않은 100% 데이터를 활용 했다고 노출이 됩니다. 여기서 질문이 있습니다.

고객사 리포트 노출 시 적용되는 0.76% 샘플링이란 고객사 GA에 집계되는 전체 범위를 기준으로 적용되는 것인가요? 아니면 제가 조회한 리포트에 해당하는 이벤트를 대상으로 하는 것인가요?  샘플링 기준에 차이가 있을 경우 데이터를 직접 비교하기가 힘들 것 같은데요, 집계된 데이터에 샘플링 비율을 역산하면 비교 가능한 유사치가 나오지 않을까 싶어 문의 드립니다.

또한 이러한 샘플링 기준은 실시간 보고서에도 동일하게 적용되는지 문의 드립니다.

2. 기준점 적용 관련 문의

고객사 앱화면에서 일부 구간에 최근에 추가 태깅을 하였는데요, 태깅 CASE가 총 5개 정도 되는데 실제 데이터는 3가지 CASE에 대해서만 집계가 되어서요.

리포트를 확인해보니 '기준점 적용됨'이라고 표기가 됩니다. 이를 토대로 조회가 안 되는 데이터량이 부족하여 리포트에 노출이 안되는 것으로 이해 했습니다. 그런데 1번에서 말씀드렸듯 고객사의 서비스는 트래픽 양이 상당한데요, 데이터량이 부족하다는 것이 잘 이해가 안되어서 문의 드립니다.

기준점 적용 시 샘플링된 데이터량을 기준으로 적용이 되는지요?  0.76% 샘플링 과정에서 데이터량이 줄어들어서 그런 것인지 궁금해서 문의 드립니다. 이런 경우 단순히 데이터가 추가로 쌓일 때까지 기다리면 모든 데이터가 집계 될 수 있는건가요?

질문이 좀 길었습니다....GA는 팔 수록 궁금한게 생기네요, Ratel님은 어떻게 이렇게 깊이 있는 역량을 쌓으셨는지 부럽기도 합니다. 역량을 쌓으려면 실전 경험을 다양하게 하는 방법 밖에 없겠죠? 이 홈페이지를 통해 많이 배우고 있고, 감사드립니다.
전체 1

  • 2022-08-01 00:46

    안녕하세요, 곰이되고싶어요님!
    저는 큰 규모의 GA 프로젝트를 많이 하면서.. GA로 이것저것 많이 하다 보니 자연스럽게 지식들이 쌓이게 되었습니다. 그리고 원리를 이해하기 위해 깊게 파보는 성향도 한몫을 한 것 같습니다 ㅎㅎ
    제 사이트가 도움이 되고 있다니 저도 기분이 좋네요 :)

    -----------------
    1. 샘플링 기준 관련 문의
    전체 범위가 아닌 조회한 리포트의 기간이 기준입니다. 리포트에 설정된 기간에 포함된 이벤트 수가 기준(1000만개)보다 많다면 샘플링이 적용되게 됩니다.
    그래서 샘플링을 없애거나 줄이기 위해 리포트의 기간을 줄이는 방법을 사용할 수도 있습니다. 그리고, 샘플링은 탐색 보고서와 같이 집계된 데이터를 임시쿼리를 통해 조회할 때만 적용이 되기 때문에 실시간 보고서를 포함한 대부분의 기본 보고서에서는 적용되지 않습니다.

    2. 기준점 적용 관련 문의
    아쉽게도 질문 주신 내용을 설명할 수 있는 데이터 기준점에 대한 구글 측의 자세한 자료는 없습니다. 제 견해로는 샘플링은 일부 데이터만으로 전체 데이터를 표현하기 위해 사용되기 때문에, 원리상 데이터의 기준점이 적용된 이유는 이해하신대로 샘플링에 사용된 표본(=데이터량이 줄어들음)에 미집계된 2가지 CASE에 대한 데이터가 적었기 때문으로 추정됩니다.

    이 경우에는 조회기간 중 해당 데이터들을 미수집한 기간이 포함되어 있다면 제외하시고, 데이터가 추가로 쌓일 때까지 기다리시는 것을 권장드립니다.

    -----------------
    GA4 유료버전이 공식적으로 나와있지 않다보니, 트래픽이 많은 계정의 경우에는 데이터를 보기 쉽지 않겠네요..
    지금 상황에서 이상적인 방법은 불필요한 이벤트는 최대한 줄이고, 조회기간을 최소화시켜서 샘플링을 피하는 것이 상책일 것 같습니다 :)

    추가적으로 유니버셜 애널리틱스에 대한 내용이지만, 아래 글도 참고해 보시는 것을 추천드려요!
    - https://dachata.com/google-analytics-tips/post/dealing-with-google-analytics-sampling/


error: 마우스 우측 클릭 금지