카테고리 없음

[GA4] traffic_source란? 빅쿼리에 수집되는 ga 소스 매체 값 (2)

datahaseo 2025. 1. 18. 00:02

안녕하세요 데이터 하세오 🙂 입니다!

지난 글에서는 빅쿼리에 수집되는 GA4 의 소스 매체 값 중 collection_traffic_source 를 알아보았는데요,

오늘은 그에 이어서 'traffic_source' STRUCT 에 대해 알아보겠습니다.

<빅쿼리에 수집되는 GA4 의 소스 매체가 궁금하다면? 이전 글을 참고해주세요!>

traffic_source 란?

빅쿼리 스키마 가이드에서 설명하는 해당 필드는 사용자를 처음 획득한 트래픽 소스에 대한 정보가 포함됩니다.

필드 이름데이터 유형설명

traffic_source.name 문자열 사용자를 최초로 획득한 마케팅 캠페인의 이름. 일중 표에서는 이 필드가 채워지지 않습니다.
traffic_source.medium 문자열 사용자를 최초로 획득한 매체(유료 검색, 자연 검색, 이메일 등)의 이름. 일중 표에서는 이 필드가 채워지지 않습니다.
traffic_source.source 문자열 사용자를 최초로 획득한 네트워크의 이름. 일중 표에서는 이 필드가 채워지지 않습니다.

그리고 '사용자가 설치 후 후속 캠페인과 상호작용하면 traffic_source 값이 변경되지 않습니다.' 라는 문구가 있는데요,

어떤 의미인지 알아보겠습니다.

traffic_source 는 '사용자의 첫 소스 매체 경로' 를 의미

결론적으로는 traffic_source 에는 사용자가 웹 사이트에 처음 들어왔을 때의 소스 / 매체 경로를 의미합니다.

이에 대해 이해하려면 사용자 단위 / 세션 단위 / 이벤트 단위 를 이해하면 좋을 것 같은데요,

예를 들어

'사용자 J' 가 옷 쇼핑몰을 10. 16 ,17, 18 매일 한 번씩 들어갔다고 가정해보겠습니다.

사용자 단위로 본다면?

'J' 는 구글 검색 광고 , 네이버 올가닉 , DIRECT 유입 경험이 있고,

양말 , 맨투맨 PDP 조회 경험 ,

양말 장바구니 담기,

맨투맨 구매 경험 ,

이벤트 조회 경험이 있습니다.

세션 단위로 보면?

세션 A - 구글 검색 광고로 첫 방문하여 양말 PDP 조회한 날

세션 B- 네이버 올가닉으로 방문하여 맨투맨 PDP 를 조회하고, 양말 장바구니에 담은 날

세션 C - 즐겨찾기로 방문하여 이벤트 기획전 페이지를 보고 맨투맨을 구매한 날

이벤트 단위로 본다면?

session_start - 구글 검색 광고로 유입

session_start - 네이버 올가닉으로 유입

session_start - direct 로 직접 유입

view item - 양말 본 이벤트

view item- 맨투맨 본 이벤트

add_to_cart - 양말 장바구니 담은 이벤트

purchase - 맨투맨 구매 이벤트

범위가 사용자 > 세션 > 이벤트 순으로 커지는게 느껴지실까요?

그럼 사용자의 첫 소스 매체는

세션이 A , B ,C 로 세 개의 유입 기록이 있지만,

J 가 처음으로 들어왔던 세션 A 의 '구글 검색 광고' 가 바로 traffic_source 값이 됩니다.

빅쿼리에서 수집된 traffic_source 예시

빅쿼리에는 실시간으로 수집되는 intra 테이블과 1-2일 정제된 후 쌓이는 테이블로 두 가지가 있는데,

traffic_source는 실시간 테이블에서는 수집되지 않고, 정제된 후의 값으로만 확인이 가능합니다.

아래 결과를 보시면

1016 first_vist 당시 google / searchad 와 gclid 가 수집된 후

동일한 세션에서 naver / brand_ad 로도 방문했었지만,

traffic_source 는 google /cpc 로 모두 채워져있죠

이후 다른 날에 같은 cid 로 방문하더라도

daum / organic , naver / display_ad 는 이벤트 단위로 수집이 되고 (유입 당시 url 에 있는 정보)

traffic_source 는 first_visit 당시의 google / cpc 로 채워져 있습니다.

참고로 여기서의 사용자 단위, cid 라는 것은 브라우저, 기기 단위로 생성되는 쿠키 ID 를 의미하는데요,

이렇게 GA 를 설치하면 자동으로 생성되는 '_ga' 쿠키에 있는 값의 후반부

= GA4 'Client ID' = 빅쿼리 'user_pseudo_id' 는 모두 같은 값입니다.

즉, 브라우저나 기기가 계속 동일하고, 해당 쿠키의 유효기간인 2년 동안 쿠키가 새로 생성되지 않았다면

traffic_source 값은 동일하게 유지됩니다.

오늘은 이렇게 빅쿼리에 있는 소스 매체 struct 중 traffic_source 가

사용자 단위로서 '첫 유입 소스 매체' 라는 것을 알아보았습니다.

읽어주셔서 감사합니다:)