9월 9일에 진행되었던 Snowflake World Tour Seoul 2025에 참석한 후기를 작성합니다. 듣고 싶은 여러 세션들이 있었지만, 동시에 진행되어 몇 가지 선택해서 듣고온 5가지 세션들에 대해서 듣고온 내용 공유합니다.
1. 데이터 파이프라인
Snowflake SE분들이 발표해주신 세션의 핵심은 'Zero Ops'였습니다. 데이터 엔지니어가 서버 튜닝, 인프라 관리 같은 운영 부담에서 벗어나, 진짜 비즈니스 가치를 만드는 로직 개발에만 집중해야 한다는 뜻입니다.
- SQL 사용자: Dynamic Tables 라는 기능을 통해 최종적으로 원하는 모양의 데이터를 SQL로 선언만 하면, 중간 데이터 흐름과 업데이트 관리는 Snowflake가 전부 알아서 처리합니다.
- Python 사용자: Snowpark는 이미 Spark나 Pandas에 익숙한 개발자들이 쉽게 쓸 수 있는 기능입니다. 데이터를 코드로 가져오지 말고, 코드를 데이터가 있는 곳으로 보내서 데이터 외부 유출로 인한 성능 저하나 보안 위험 없이, Snowflake 내부에서 Python 코드를 바로 실행할 수 있습니다.
결국, 귀찮고 복잡한 기술 문제는 플랫폼에 맡기고, 개발자는 비즈니스 문제 해결에만 집중하라는 명확한 메시지였습니다.
2. 나이스평가정보
- 도전 과제: 나이스평가정보는 해외 고객에게 국내 기업/금융 데이터를 판매할 때, 비효율적인 수작업과 별도 플랫폼 구축 비용에 발목이 잡혀 있었습니다.
- 해결책: Snowflake 마켓플레이스에 데이터를 '상품'처럼 등록했습니다.
- 성과: 별도 플랫폼 구축 없이 전 세계 수천 곳의 잠재 고객에게 데이터를 즉시 노출시켰습니다. 데이터 상품 준비 시간은 85% 단축, 플랫폼 구축 대비 비용은 75% 절감했습니다. '프로바이더 스튜디오'라는 관리 도구 덕분에 비전문가도 쉽게 데이터를 상품화할 수 있었다고 합니다.
3. Openflow
데이터 분석의 시작은 결국 '데이터 로딩'입니다. Openflow 세션에서는 이 고질적인 문제를 해결하는 데 집중했습니다.
- 정체: 검증된 오픈소스인 Apache NiFi를 기반으로, Snowflake로 데이터를 안정적으로 가져오기 위해 설계된 서비스입니다.
- 특징: 정형, 비정형, 반정형, 배치, 스트리밍... 그냥 모든 데이터를 다 지원합니다. 30개 이상의 커넥터와 200개 이상의 처리 컴포넌트를 제공하는데, 특히 오라클 DB의 변경 데이터를 실시간으로 잡아내는(CDC) 기능이 매우 효율적이라고 강조했습니다.
4. 삼성전자 News
- 도전 과제: 서비스 중단 없이 인프라를 이전하고, 이전 후 발생한 성능 및 비용 문제를 해결해야 했습니다.
- 마이그레이션 비결:
- Data Sharing: 원본 데이터를 옮기지 않고 새 환경에서 실시간 접근해 안전하게 테스트했습니다.
- Dynamic Tables / Stream & Task: 보안 제약으로 막힌 데이터를 우회 확보하고, 두 시스템 간 데이터 정합성을 유지했습니다.
- 운영 최적화:
- 성능 문제: 쿼리가 느려 '쿼리 프로파일'로 분석해 보니, 데이터 클러스터링 문제였습니다. 데이터를 재구성(Re-clustering)하여 해결했습니다.
- 비용 문제: BI 도구가 10분마다 쿼리를 날리는데, 웨어하우스 자동 중지 설정이 10분이라 24시간 내내 꺼지지 않는 비극이 발생했습니다. 해결책은? 자동 중지 시간을 5분으로 줄였습니다. 이 간단한 설정 변경 하나로 총 75%의 비용을 절감했습니다.
5. 네패스
최신 AI 모델을 쫓기보다 데이터 품질과 준비에 70%의 중요도를 부여했습니다. 복잡한 인프라 구축 대신, Snowflake에 내장된 Cortex AI를 활용했습니다.
- 활용 사례:
- SQL 내 AI: 현업 분석가들이 익숙한 SQL 환경에서 CORTEX.SUMMARIZE() 같은 AI 함수를 바로 호출해 텍스트를 요약, 분류했습니다.
- 기존 시스템 연동: 제조 실행 시스템(MES)에 'AI 분석 리포트' 버튼을 추가, 클릭 한 번으로 보기 좋은 HTML 보고서를 자동 생성했습니다.
- 자연어 쿼리: 기술 지식이 없는 사용자도 "지난달 불량률 제일 높은 제품 뭐야?"라고 질문하면, AI가 데이터를 조회하고 차트로 보여줬습니다.
- 성과: AI 프로젝트 비용 43% 절감, 개발 및 분석 속도 76% 향상. 실용적인 접근이 실질적인 성과를 냈습니다.
'Snowflake' 카테고리의 다른 글
| [Snowflake] MSSQL에서 Snowflake까지, CDC 파이프라인 구축 (0) | 2025.11.04 |
|---|---|
| [Snowflake] Container 기반 Notebook에 패키지 임포트시 오류 해결 (0) | 2025.11.04 |