Sign in Subscribe

Topic

Products

데이터 인텔리전스 플랫폼 통합을 위한 오픈소스 기술 검토 및 실험 결과를 제공합니다. 다양한 데이터 처리 기술의 성능, 확장성, 호환성에 대한 심층 분석과 실제 구현 사례를 살펴볼 수 있습니다.

DIP 플랫폼 TPC-DS 벤치마크 테스트 계획

DIP 플랫폼의 배치 ELT, 실시간 CDC, 분석 쿼리 성능을 TPC-DS 표준 벤치마크로 정량 측정하는 테스트 계획서입니다. Spark, StarRocks, OLake, Kafka CDC 파이프라인을 비교 검증합니다.

RKE2 CNI 성능 비교: Canal vs Cilium - 데이터 중심 워크로드를 위한 최적 선택

RKE2 환경에서 기본 CNI 대신 Cilium을 적용하는 방법과 이점을 다룹니다. Cilium의 eBPF 기술을 활용하여 기존 iptables의 성능 한계를 극복하고, 강력한 보안 정책 및 네트워크 가시성을 확보하는 과정을 설명합니다. RKE2 설치 시 HelmChartConfig를 통한 Cilium 설정 및 커스터마이징 실무 가이드를 제공합니다.

Apache Flink를 활용한 API Gateway 실시간 로그 분석 파이프라인 최적화

Apache Flink를 활용하여 Kafka 메시지를 사전 가공함으로써 StarRocks 쿼리 부하를 90% 절감하고 대시보드 응답 속도를 70% 개선한 실시간 로그 분석 파이프라인 최적화 사례

CES2026 데모 - 단일 에어갭(Air-Gapped) DGX 노드 기반 고밀도 데이터 지능화 플랫폼

PAASUP DIP는 인터넷이 차단된 에어갭(Air-Gapped) 환경에서도 NVIDIA DGX SPARK 단일 노드에 배치, 실시간, LLM RAG 등 고부하 워크로드를 집적한 고밀도 데이터 플랫폼을 실증합니다. RKE2/Rancher 기반 오케스트레이션과 SaaS 방식의 통합 엔진을 통해 20여 종의 기술 카탈로그를 폐쇄망 내에서 유연하게 운영 관리하는 혁신적인 모델을 제시합니다.

Lakekeeper를 활용한 레이크하우스 거버넌스 구현 가이드

Lakekeeper를 활용한 Apache Iceberg 기반 레이크하우스 거버넌스 구축 가이드입니다. OpenFGA 기반의 세밀한 권한 관리, 역할 기반 접근 제어 구현, Spark와 StarRocks 연동을 통한 실제 사례를 단계별로 소개합니다.

실시간 로그 수집 및 분석 사례

Kafka 기반 스트리밍 아키텍처를 활용하여 API Gateway 로그를 실시간으로 수집하고, StarRocks에 저장한 뒤 Apache Superset으로 시각화하는 모니터링 시스템 구축 사례. 서비스 안정성 향상과 장애 대응 시간 단축을 실현합니다.

Lakekeeper로 시작하는 Apache Iceberg REST Catalog - 설치부터 Spark 연동까지

Apache Iceberg 데이터 레이크 환경에서 Hive Metastore(HMS)를 대체할 REST Catalog(IRC)의 도입 필요성과 장점을 다룹니다. Kubernetes 환경에 최적화된 Rust 기반 오픈소스 카탈로그 Lakekeeper의 특징과 기본 배포 아키텍처를 알아봅니다.

NVIDIA DGX Spark 활용하기: 로컬 연결부터 120B 모델 서빙까지

고성능 AI 워크스테이션인 NVIDIA DGX Spark를 도입했지만, 단순한 로컬 접속만으로는 그 잠재력을 모두 끌어내기 어렵습니다. 이 글에서는 NVIDIA Sync를 통한 간편한 기기 관리, Tailscale을 이용한 안전한 원격 액세스, 그리고 Docker Custom Script를 활용해 클릭 한 번으로 생성형 AI 서비스(Ollama, ComfyUI, TensorRT-LLM)를 배포하고 관리하는 ‘나만의 AI 프라이빗 클라우드’ 구축 과정을 상세히 다룹니다.

PostgreSQL에서 StarRocks로 CDC 구현 예제

PostgreSQL에서 StarRocks로의 실시간 CDC 파이프라인 구축 사례입니다. Debezium과 Kafka를 활용하여 초당 4,000건 이상의 데이터를 안정적으로 복제하고, Apache Superset으로 시각화했습니다. StarRocks의 MPP 아키텍처를 통해 분석 쿼리 성능이 대폭 향상되었으며, 확장 가능한 데이터 파이프라인 아키텍처를 구현했습니다.

DuckDB: 현대적인 분석용 데이터베이스 가이드

DuckDB는 SQLite의 분석 버전을 지향하는 임베디드 분석 데이터베이스입니다. 별도의 서버 설정 없이 로컬 환경에서 대용량 데이터를 빠르게 분석할 수 있으며, CSV, Parquet, JSON 등 다양한 파일 형식을 직접 쿼리할 수 있습니다. 이 글에서는 DuckDB의 아키텍처부터 설치 방법, 그리고 실무에서 활용할 수 있는 다양한 SQL 예제까지 상세히 다룹니다.