DB, ETL, 데이터 아키텍팅

NFT(대체 불가능 토큰) 서비스에서의 데이터 플랫폼 운영

TEO2 2023. 2. 21. 22:29

블록체인의 BI데이터는 어떤 식으로 보일까?

1. 데이터 정합성

 보통 게임사에서 게임 데이터의 경우에는 정합성이 미리 검증된 데이터를 바탕으로 로그, 게임 DB에 쌓인 데이터를 각 파이프라인에 따라 데이터셋에 적재가 된다. 동접이나 매출 등 실시간으로 보면 의미가 있는 데이터는 실시간으로 보기도 하지만, BI 대시보드에서 지난 시간, 지난날의 추세를 보는 것이 의미가 있기 때문에 시간별/일별 배치를 통해 각 테이블에 적재하도록 한다.

기존 게임 데이터 ERD

 반면, 블록체인 데이터의 경우에는 위 흐름으로 데이터를 쌓기보다는 address라는 '지갑주소'가 누구에게나 볼 수 있도록 공개되어 있고, 주소에 1대 1 대응으로 데이터를 확인하여 거래, 토큰 교환 등의 유저의 현황을 보는 방식이다.

블록체인의 BI 서비스를 위한 ERD

 위 ERD만 보면 ODS 테이블을 만들기 전까지의 과정을 제외하고는 일치한다. 심지어 그 과정은 BI서비스가 닿기 전인 개발사와 데이터 엔지니어링의 영역이기도 하다.

 차이가 있다면 기존의 게임 DB와 로그에서는 데이터 정합성에 대한 부분을 신경 쓰지 않아도 될 정도이다. 기존 게임DB나 로그는 테이블의 명세가 확실해서 주어진 테이블을 가지고 사업에서 어떤 부분을 중점으로 보고 싶은 지나, 게임성이 잘 드러나는 대시보드를 구연하기 위해서 오로지 BI 대시보드를 서비스하는데만 몰두할 수 있다.


2. 도메인 이해

 하지만 NFT 서비스를 위한 BI대시보드를 구성하기 위해서는 유저의 지갑 내역을 나타내는 온체인 데이터를 ODS까지 보내는 과정에서 데이터 정합성이 꼭 필요로 한다. 그리고 정합성이 검증된 이후에도 기존 게임 데이터의 파이프라인과는 다른 모든 거래 트렌젝션이 섹션별(거래, 교환, 가치 등)로 적재된 테이블에서 선별해서 대시보드에 필요한 데이터를 구성할 필요가 있었다.

 

 사업에서도 기존 서비스에 대한 대시보드와는 전혀다른 새로운 NFT 서비스를 하기 때문에 어떤 대시보드를 통해 인사이트를 얻고 싶은지 지표를 서비스하는 입장에서도 도메인 이해가 중요했다. (이후 내가 어떤식으로 이 새로운 NFT의 도메인을 이해하려고 했는지 정리할 예정이다.) 사업을 이해한 뒤에 사업이 원하는 대시보드를 정확하게 구현할 수 있었다. 그리고 NFT는 현재 계속해서 새로운 서비스가 등장하고 있기 때문에 서로의 사업 지식 격차가 최대한 나지 않도록 끊임없이 도메인에 대한 이해가 필요하다.


3. 정리하며..

 결국 결론은 도메인의 이해가 필요하다는 이야기지만, 업무를 하면서 중요하기 때문에 잊지 않도록 여러 번 깨닫는다는 것이 중요한 것 같다. 게임사에서 게임에 대한 대시보드를 서비스하다가 NFT라는 새로운 서비스를 데이터로 표현하는 방법을 1년 정도 커뮤니케이션하고, 학습했던 방식을 글로 정리해 볼 예정이다. 그래서 이후에는 도메인 이해를 했던 방법에 대해서 공유하는 글을 써봐야겠다는 생각이 들었다.

 

3-1. 첫 글에 대한 회고 (글또가 세상을 바꾼다 (tistory.com))

 첫 글에서 예정했던 "블록체인, NFT 관련 이야기"를 시작하기에 앞서 BI에서는 어떤 식으로 표현하고자 했는지 정리를 해봤다. 다음 글에서 도메인에 대한 이해과정을 글로 적으면서 NFT 블록체인에 대한 이야기가 되지 않을까 생각한다.

반응형