안녕하세요 데이터 하세오 🙂 입니다!
지난 글에서는 빅쿼리에 수집되는 GA4 의 소스 매체 값 중 collection_traffic_source 를 알아보았는데요,
오늘은 그에 이어서 'traffic_source' STRUCT 에 대해 알아보겠습니다.
<빅쿼리에 수집되는 GA4 의 소스 매체가 궁금하다면? 이전 글을 참고해주세요!>
traffic_source 란?
빅쿼리 스키마 가이드에서 설명하는 해당 필드는 사용자를 처음 획득한 트래픽 소스에 대한 정보가 포함됩니다.
필드 이름데이터 유형설명
traffic_source.name | 문자열 | 사용자를 최초로 획득한 마케팅 캠페인의 이름. 일중 표에서는 이 필드가 채워지지 않습니다. |
traffic_source.medium | 문자열 | 사용자를 최초로 획득한 매체(유료 검색, 자연 검색, 이메일 등)의 이름. 일중 표에서는 이 필드가 채워지지 않습니다. |
traffic_source.source | 문자열 | 사용자를 최초로 획득한 네트워크의 이름. 일중 표에서는 이 필드가 채워지지 않습니다. |
그리고 '사용자가 설치 후 후속 캠페인과 상호작용하면 traffic_source 값이 변경되지 않습니다.' 라는 문구가 있는데요,
어떤 의미인지 알아보겠습니다.
traffic_source 는 '사용자의 첫 소스 매체 경로' 를 의미
결론적으로는 traffic_source 에는 사용자가 웹 사이트에 처음 들어왔을 때의 소스 / 매체 경로를 의미합니다.
이에 대해 이해하려면 사용자 단위 / 세션 단위 / 이벤트 단위 를 이해하면 좋을 것 같은데요,
예를 들어
'사용자 J' 가 옷 쇼핑몰을 10. 16 ,17, 18 매일 한 번씩 들어갔다고 가정해보겠습니다.
사용자 단위로 본다면?
'J' 는 구글 검색 광고 , 네이버 올가닉 , DIRECT 유입 경험이 있고,
양말 , 맨투맨 PDP 조회 경험 ,
양말 장바구니 담기,
맨투맨 구매 경험 ,
이벤트 조회 경험이 있습니다.
세션 단위로 보면?
세션 A - 구글 검색 광고로 첫 방문하여 양말 PDP 조회한 날
세션 B- 네이버 올가닉으로 방문하여 맨투맨 PDP 를 조회하고, 양말 장바구니에 담은 날
세션 C - 즐겨찾기로 방문하여 이벤트 기획전 페이지를 보고 맨투맨을 구매한 날
이벤트 단위로 본다면?
session_start - 구글 검색 광고로 유입
session_start - 네이버 올가닉으로 유입
session_start - direct 로 직접 유입
view item - 양말 본 이벤트
view item- 맨투맨 본 이벤트
add_to_cart - 양말 장바구니 담은 이벤트
purchase - 맨투맨 구매 이벤트
범위가 사용자 > 세션 > 이벤트 순으로 커지는게 느껴지실까요?
그럼 사용자의 첫 소스 매체는
세션이 A , B ,C 로 세 개의 유입 기록이 있지만,
J 가 처음으로 들어왔던 세션 A 의 '구글 검색 광고' 가 바로 traffic_source 값이 됩니다.
빅쿼리에서 수집된 traffic_source 예시
빅쿼리에는 실시간으로 수집되는 intra 테이블과 1-2일 정제된 후 쌓이는 테이블로 두 가지가 있는데,
traffic_source는 실시간 테이블에서는 수집되지 않고, 정제된 후의 값으로만 확인이 가능합니다.
아래 결과를 보시면
1016 first_vist 당시 google / searchad 와 gclid 가 수집된 후
동일한 세션에서 naver / brand_ad 로도 방문했었지만,
traffic_source 는 google /cpc 로 모두 채워져있죠
이후 다른 날에 같은 cid 로 방문하더라도
daum / organic , naver / display_ad 는 이벤트 단위로 수집이 되고 (유입 당시 url 에 있는 정보)
traffic_source 는 first_visit 당시의 google / cpc 로 채워져 있습니다.
참고로 여기서의 사용자 단위, cid 라는 것은 브라우저, 기기 단위로 생성되는 쿠키 ID 를 의미하는데요,
이렇게 GA 를 설치하면 자동으로 생성되는 '_ga' 쿠키에 있는 값의 후반부
= GA4 'Client ID' = 빅쿼리 'user_pseudo_id' 는 모두 같은 값입니다.
즉, 브라우저나 기기가 계속 동일하고, 해당 쿠키의 유효기간인 2년 동안 쿠키가 새로 생성되지 않았다면
traffic_source 값은 동일하게 유지됩니다.
오늘은 이렇게 빅쿼리에 있는 소스 매체 struct 중 traffic_source 가
사용자 단위로서 '첫 유입 소스 매체' 라는 것을 알아보았습니다.
읽어주셔서 감사합니다:)