데이터 혼합하기
데이터 스튜디오의 데이터 혼합 기능을 사용하면, 여러 데이터 소스를 기반으로한 차트를 생성할 수 있습니다. 동일한 유형의 데이터 소스뿐만 아니라 서로 다른 유형도 동일한 키 값을 갖고 있다면 데이터 혼합 기능으로 결합이 가능합니다.
데이터 혼합이란?
데이터 혼합은 SQL의 조인과 같은 개념입니다. 서로 다른 데이터 소스가 갖고있는 날짜, 고객 번호 등과 같은 공통 필드를 통합 키로 지정하여 데이터를 합칠 수 있습니다.
혼합된 데이터 생성 방법
1. 메뉴를 통해서 생성하는 방법
보고서의 [리소스]-[혼합 소스 관리] 메뉴를 클릭합니다.
혼합 소스 관리 화면에서 [ADD A BLEND] 버튼을 클릭합니다.
이동한 데이터 혼합 화면에서는 아래의 과정으로 설정을 진행합니다.
- 기준이 될 첫 번째 데이터 소스를 선택합니다.
- [Join another table] 버튼으로 혼합할 다른 데이터 소스를 선택합니다.
- 혼합할 측정기준, 측정항목을 각각의 데이터 소스에 설정합니다. 이때, 데이터를 연결하는 데 사용할 측정기준은 모든 데이터 소스에 공통적으로 추가되어야 합니다.
- 필요시 데이터 소스에 필터 설정을 합니다.
마지막으로 가장 중요한 혼합 방식을 설정하는 단계가 남았습니다. 각각의 데이터 소스 사이에 위치한 [Configure join]이라는 버튼을 클릭합니다.
클릭 시 뜨는 화면에서는 아래와 같이 두 데이터 소스를 연결할 측정기준을 설정합니다.
추가적으로 화면 상단에는 Join operator라는 설정이 있는데, 각 유형별로 혼합되는 데이터에 차이가 발생하기 때문에 각각의 유형을 개념적으로 이해하고 있어야 합니다. 이 설정은 일반적인 상황이라면 기본 값인 [레프트 아우터]를 사용하는 것을 권장드립니다.
- 레프트 아우터 : 좌측의 모든 데이터 포함 + 좌측의 연결값과 매칭되는 우측의 데이터만 포함합니다.
- 라이트 아우터 : 우측의 모든 데이터 포함 + 우측의 연결값과 매칭되는 좌측의 데이터만 포함합니다.
- 이너 : 좌,우측의 연결값과 매칭되는 데이터만 포함합니다.
- 풀 아우터 : 좌, 우측의 모든 데이터를 포함합니다.
- Cross : 좌, 우측의 모든 데이터를 조합합니다. 별도의 연결키가 필요없으며, 각 데이터 소스의 행들이 조합되기 때문에 데이터의 양이 무수히 많아지게 됩니다. (일반적으로 잘 사용하지 않는 유형입니다.)
혼합 방식까지 설정을 끝마치면, 이제 혼합 소스를 저장하고 차트에서 데이터 소스로 사용할 수 있습니다.
2. 차트 간의 데이터 혼합
데이터를 혼합하기 위한 가장 쉬운 방법입니다. 혼합할 두 차트를 선택한 뒤 마우스 오른쪽 클릭을 합니다. 메뉴에서 [데이터 혼합]을 클릭하여 데이터가 혼합된 새로운 차트를 생성합니다.
참고. 이 방식으로 만들어진 혼합 소스의 Join operator는 [레프트 아우터]이며, 이 소스는 [리소스]-[혼합 소스 관리] 메뉴에서 수정이 가능합니다.
혼합된 데이터 활용 예시
1. 활성, 우수 사용자 측정항목 통합해서 보기
구글 애널리틱스의 활성, 우수 사용자 측정항목은 차트 당 하나씩만 추가할 수 있습니다. 여러 개의 활성 사용자를 설정할 경우에는 아래와 같이 차트에 에러가 표시됩니다.
이때는 각 측정항목이 설정된 두 차트의 데이터를 혼합하여 하나의 차트에서 위 측정항목들을 모아볼 수 있습니다.
2. 구글 트랜드와 구글 애널리틱스 데이터 혼합하기
구글 트랜드와 구글 애널리틱스 데이터를 혼합하면, 구글의 검색어와 사이트 방문 동향을 한번에 볼 수 있습니다. 이때 구글 트랜드의 키워드는 이 사이트의 핵심 콘텐츠 중 하나인 "구글 애널리틱스"로 설정했습니다
3. 다른 구글 애널리틱스 데이터 혼합하기
운영하는 사이트가 여러 개일 경우, 서로 다른 구글 애널리틱스의 데이터를 혼합하여 데이터를 종합적으로 볼 수 있습니다.
그 외에도 데이터 스튜디오에서는 다양한 데이터 커넥터가 존재합니다. 데이터 혼합 기능을 통해 구글 스프레드 시트, 구글 서치 콘솔, CRM 등 다양한 데이터를 연결하여 보고서를 제작할 수 있습니다.
다음 강의에서는 보고서를 공유하는 방법에 대해 알아보겠습니다.
좋은 정보 감사합니다.
혹시 연도별로 정리 된 원시데이터의 데이터를 혼합하여 예를 들어 2021년도 1월 데이터와 2022년 1월 데이터를 하나의 차트에서 막대로 비교할 수 있는 방법에 대해 알고 계신가요?
안녕하세요, 이명재님!
간단하게 말씀드리자면 두 원시데이터를 조인 연산자는 "풀 아우터"를 선택하고, 두 데이터 소스의 "날짜"에 해당하는 측정 기준을 조인 조건으로 혼합하여 생성한 [혼합 데이터] 소스를 막대 차트에서 사용하면 됩니다.
위와 같이 설정하면 날짜별로 두 데이터를 막대 그래프에서 한 번에 볼 수 있습니다 🙂
크로스도 뭔가 이유가 있을 것 같은데, 쓴다면 어떤 상황일까요? 축구 경우의 수 계산이나 이런 때 사용하나요? 아니면 광고 소재와 타겟팅 조합 종류를 확인할 때 쓸까요?
크로스 조인은 A,B가 합쳐질 수 있는 모든 경우의 수를 얻기 위해 사용됩니다.
예를 들어, 아래와 같은 두 테이블이 있는 경우
A. 색상
B. 크기
크로스 조인을 사용하면 모든 색상과 크기의 조합을 결과로 얻을 수 있습니다.
말씀하신 것처럼 광고 소재, 타겟팅 조합의 모든 경우의 수를 얻을 때도 사용될 수 있겠네요 ㅎㅎ