Immersion In Data

분류 전체보기 199

[Snowflake] Snowflake World Tour Seoul 2025 참관 후기

9월 9일에 진행되었던 Snowflake World Tour Seoul 2025에 참석한 후기를 작성합니다. 듣고 싶은 여러 세션들이 있었지만, 동시에 진행되어 몇 가지 선택해서 듣고온 5가지 세션들에 대해서 듣고온 내용 공유합니다. 1. 데이터 파이프라인Snowflake SE분들이 발표해주신 세션의 핵심은 'Zero Ops'였습니다. 데이터 엔지니어가 서버 튜닝, 인프라 관리 같은 운영 부담에서 벗어나, 진짜 비즈니스 가치를 만드는 로직 개발에만 집중해야 한다는 뜻입니다. SQL 사용자: Dynamic Tables 라는 기능을 통해 최종적으로 원하는 모양의 데이터를 SQL로 선언만 하면, 중간 데이터 흐름과 업데이트 관리는 Snowflake가 전부 알아서 처리합니다.Python 사용자: Snowpar..

Snowflake 2025.11.04

[Snowflake] MSSQL에서 Snowflake까지, CDC 파이프라인 구축

MSSQL의 데이터를 Snowflake로 실시간 동기화를 구축할 수 있는 방법을 공유합니다.MSSQL의 변경 데이터를 실시간으로 Snowflake에 반영할 수 있는가?기존 파이프라인보다 더 빠른 성능을 보여줄 수 있는가?데이터를 다른 계정(Snowflake)과 간편하게 공유할 수 있는가?결론부터 말씀드리면, "전부 가능했습니다." 이 글에서는 저희가 구축한 아키텍처부터 성능 테스트 결과, 그리고 Snowflake의 데이터 공유까지 전 과정을 공유합니다. 1. 아키텍처: AWS DMS와 Snowflake의 조합저희는 "MSSQL → S3 → Snowflake"로 이어지는 실시간 CDC(Change Data Capture) 파이프라인을 구축했습니다. 전체 흐름은 4단계로 자동화됩니다.1단계: 변경 데이터 ..

Snowflake 2025.11.04

[Snowflake] Container 기반 Notebook에 패키지 임포트시 오류 해결

Snowflake의 컨테이너 런타임(SPCS) 기반 노트북은 AI/ML 워크로드를 위해 강력한 CPU/GPU 리소스에 접근할 수 있게 해주는 훌륭한 기능입니다. 하지만 표준 노트북 환경과 달리, 이 컨테이너 환경에서 Python 패키지를 설치하는 것은 몇 가지 독특한 제약 사항과 절차를 따릅니다. 컨테이너 노트북에서 패키지를 설치할 때 겪을 수 있는 오류와 그 해결 과정을 공유합니다. ML 모델링을 위해 numpy와 snowflake-ml-python을 설치중 오류 발생ML 모델을 만들기 위해 컨테이너 런타임 노트북을 생성 후 ML에 필요한 numpy, pandas, scikit_learn, snowflake-ml-python 등의 .whl 파일을 Snowflake Stage에 업로드한 뒤, 'Stag..

Snowflake 2025.11.04

AWS Glue를 통한 Snowflake로의 ETL 수행하기

1. IAM 역할 생성S3의 데이터를 접근하기 위한 AmazonS3FullAccess, Glue 서비스를 위한 AWSGlueServiceRole, 보안 암호를 위한 SecretsManagerReadWrite 권한을 가진 역할을 생성합니다.  2. S3 bucket 생성 및 데이터 업로드S3 버킷을 생성하고, 그 버킷에 데이터를 업로드합니다.  3. Glue Database/Table 생성  4. Glue Crawler 생성Crawler 생성이 완료되었다면, Run crawler 버튼을 통해 크롤러를 실행합니다. 크롤러 실행이 완료되었다면, Data Catalog가 생성되었습니다.  5. AWS Secrets Manager 보안 암호 생성값에 Snowflake의 User, Password, Warehous..

AWS 2024.06.03

[SharePlex] 운영중인 큐에서 복제 대상 추가

1. config 파일에 복제 대상 추가2. Post 프로세스 중지sp_ctrl> stop postPost 프로세스를 먼저 중지시켜 Target에 적용되지 않도록 합니다.3. Activate config sp_ctrl> activate config 복제 대상이 추가된 config 파일을 활성화 시킵니다. Post 프로세스가 중지되었기 때문에 데이터가 Post Queue에 쌓이게 됩니다.  Post 프로세스를 중지시키지 않으면 Out of sync가 발생합니다.4. 초기적재를 위한 SCN 확인SQL> select current_scn from v$database;확인한 SCN 부터 초기적재를 하기 위함입니다.5. 초기적재Datapump를 활용하여 초기적재를 시작합니다. (Target에 테이블 생성됨)  4..

SharePlex 2024.05.02

[SharePlex] 프로세스 삭제

1. sp_로 시작하는 프로세스 검색splex@source:/splex/prod/bin]$ ps -ef | grep sp_splex    13532     1  0 16:22 ?        00:00:10 /splex/prod/.app-modules/sp_ordr -u2100 splex    13542     1  0 16:23 ?        00:00:01 /splex/prod/.app-modules/sp_xport -u2100 splex    20863 14695  0 17:45 pts/1    00:00:00 grep --color=auto sp_ 2. 없어지지 않은 프로세스 죽이기 splex@source:/splex/prod/bin]$ kill -9 13532 135423. splex ipc ..

SharePlex 2024.05.02

[SharePlex] Parameter 정리

1. set param SP_OCT_MIN_SESSIONS 8  ## default : 8동시 트랜잭션의 데이터를 포함하도록 유지하는 최소 하위 대기열 수를 제어 Post 프로세스가 자체 동시성을 높일 수 있도록 하여 PEP(Post Enhanced Performance) 기능을 지원 PEP 기능은 SP_OPO_DEPENCY_CHECK 매개변수로 제어됨  최상의 결과를 얻으려면 SP_OCT_MIN_SESITES를 대상 시스템에 있는 CPU 코어 수 이상으로 설정 2. set param SP_OCT_REPLICATE_DDL 3 ## default : 3복제 중인 활성화 된 config 개체에 대해 ALTER, TRUNCATE 작업을 복제하는지 여부를 제어 0 : ALTER 와 TRUNCATE 둘 다 비활성..

SharePlex 2024.05.02

[ORACLE] Datapump

1. 권한 부여SQL> grant EXP_FULL_DATABASE, IMP_FULL_DATABASE to splex; 2. Directory 조회SQL> SELECT * FROM DBA_DIRECTORIES; 3. Directory 생성 및 권한 부여SQL> CREATE DIRECTORY DUMP AS '/u02/splex/var/dump'; # DUMP - 사용하고자 하는 DIRECTORY 이름, '/oracle/dumpfile' - DIRECTORY가 사용할 물리적인 경로SQL> GRANT READ, WRITE ON DIRECTORY DUMP TO SPLEX; # READ 권한 - Import Pump를 수행하기 위해 필요, WRITE 권한 - Export Pump를 수행하기 위해 필요SQL> GRA..

Oracle 2024.04.26

[ORACLE] ORA-00257 archiver error

ORA-00257 에러 발생 아카이브 로그 리스트 확인SQL> archive log listarchive log mode로 운영되고 있으며, 49번째 redo log가 archiving 되어야 하지만, 현재 archive 저장영역(db_recovery_file_dest_size)의 사용량이 100%이기 때문에 archive 되지 못하고 있는 상태 v$log 조회SQL> select * from v$log;1, 2, 3번 redo log 그룹이 공통적으로 아카이빙이 되지 않았음(ARC=NO) db_recovery_file_dest_size 확인SQL> show parameter db_recovery_file_dest_size; Archive Log 삭제# rman targ..

Oracle 2024.04.24