SQL, 빅쿼리

구글시트에서 빅쿼리(BigQuery)를 연결하는 데이터 커넥트(Data Connect)를 사용해보자

TEO2 2023. 4. 20. 23:51

 이번 글에서는 우리가 웹에서 엑셀처럼 이용할 수 있는 구글시트에 대해서 데이터 분석의 관점에서 기능을 알아보고자 한다. 바로 커넥티드 시트와 관련된 내용이다.

메뉴 - 데이터 - 데이터 커넥터 속 BigQuery에 연결

 데이터 커넥터의 'BigQuery에 연결'에서는 매일 쌓이는 (1) 클라우드 데이터(빅쿼리)를 연결하고, (2) 차트 대시보드를 만들며, 그 대시보드를 원하는 시간에 (3) 자동 새로고침까지 가능한 기능이 있다. 아래 그와 관련된 구글의 공식 문서 링크이다.

Use BigQuery data in Google Sheets - Google Docs Editors Help

 

Use BigQuery data in Google Sheets - Google Docs Editors Help

 

support.google.com

 위 링크를 통해서 빅쿼리 커넥티드 시트에 관한 전반적인 사용법을 알 수 있다. 그리고 이 글에 나오는 방법을 포함해서 직접 사용하면서 알았던 기능을 알아보려고 한다.

 

 아래는 위 기능으로 빅쿼리 공개 데이터셋을 연결한 모습이다.

 빅쿼리의 테이블을 연결해서 데이터를 볼 수 있는 것만으로도 큰 장점일 수 있지만, 여기서 조~금 더 기능을 이용하는 방법이 있다.

 첫 번째 소개할 기능이 바로 '맞춤 쿼리 작성'이라는 기능이다.

 해당 기능은 아래처럼 실제 빅쿼리에 연결할 쿼리를 작성하는 것이다. 여기서 이용할 수 있는 기능은 매개변수라는 기능인데, 해당 기능을 이용해서 쿼리의 where 절을 시트의 값으로 대체할 수 있는 것이다. 필요한 데이터셋의 모든 데이터를 조회하기보다 더 효율적인 방법이다.

 예시를 위해 간단하게 날짜만 설정했지만, 얼마든지 다양한 매개변수를 이용이 가능하다.

 

 두 번째로는 해당 데이터를 이용한 차트 삽입이다.

 우선 연결된 데이터의 시트에서 피봇테이블로 원하는 데이터를 집계를 한다.

 피봇에 조금 더 추가되었으면 하는 기능이 있다면 엑셀에 있는 사용자 함수를 이용해 집계할 수 있었으면 좋겠다. 비정형 대시보드의 특성상 사용자가 원하는 디멘젼과 메트릭을 넣고, 그에 해당하는 집계를 할 수 있어야 한다. 하지만 기본적인 합, 평균, 분산, 최대, 최소 등은 존재하지만 사분위수, 누적 등을 그룹별로 계산해주지는 못하고 있다.

 위처럼 간단하게 연결한 데이터에 피벗테이블, 차트를 삽입까지 할 수 있다. 팁이 한 가지 있다면 엑셀에는 없고, 구글시트에 있는 기능인데, 차트에 연결 후 데이터가 계속 변화하기때문에 데이터 범위를 열로만 지정하면 해당하는 열의 모든 데이터를 범위로 지정할 수 있다.

 

 세 번째로는 새로고침을 예약하는 방법이다. 

 최소 시간별로 데이터를 업데이트하고, 연결할 수 있다. 아래처럼 새로고침을 할 때 연관된 피봇테이블을 모두 새로고침할 수 있어서 유용하게 사용할 수 있다. 전체 새로고침을 활성화하면 모든 피봇테이블을 비롯해서 미리 보기까지 업데이트된다.

 

정리하며

 구글 시트의 유용한 기능중 하나인 커텍티드 시트에 대해 알아봤다. BigQuery에 연결하고, 해당 데이터를 이용해 차트 대시보드를 만들며, 그 대시보드를 원하는 시간에 자동 새로고침까지 가능한 기능이 있다. DB를 연결하여 데이터를 당겨오고 난 뒤에 BI툴을 따로 많이 사용하고 있지만, 사실 이용자의 입장에서 친숙한 것은 엑셀이기도 하다.

 

 빅쿼리에서 집계한 데이터를 이용해서 대시보드를 보고, 그 대시보드의 데이터를 추출해서 다시 엑셀로 가져가서 피봇테이블로 작업을 하고 있다면, 구글에서 제공하는 커넥티드시트를 이용해 보는 것은 어떨까?

반응형