DIP 플랫폼 TPC-DS 1 TB 벤치마크 TPC-DS SF-1000(1TB, 63억 행) 규모로 DIP 플랫폼의 Batch ELT 적재 성능(1,451K rows/sec)과 StarRocks 쿼리 응답 속도(GeoMean 2.2초)를 검증합니다. CN 노드 스케일링 효과와 Trino 대비 성능 우위, Iceberg 파티션 전략까지 정량 분석한 결과를 공유합니다.
MCP로 서비스를 AI 에이전트와 연결하기 - Embedded vs Bridge 패턴 실전 구현 이 글에서는 FastAPI 기반 RAG 서버에 MCP를 도입한 경험을 바탕으로, 앱에 MCP를 직접 임베딩하는 Embedded 패턴과 별도 프로세스로 분리하는 Bridge 패턴의 차이, Transport 선택 기준, 그리고 LLM이 Tool을 올바르게 사용하도록 유도하는 description 작성법까지 단계별로 살펴봅니다.
DIP 플랫폼 TPC-DS 벤치마크 — Part 1. Batch ELT & Query 성능 데이터 플랫폼, 도입 전에 성능부터 증명할 수 있을까? DIP 플랫폼을 TPC-DS SF-100 표준 벤치마크로 검증했습니다. Batch ELT 적재 속도부터 분석 쿼리 응답시간, 동시성 한계까지—숫자로 확인한 결과를 공유합니다.
DIP 플랫폼 TPC-DS 벤치마크 테스트 계획 DIP 플랫폼의 배치 ELT, 실시간 CDC, 분석 쿼리 성능을 TPC-DS 표준 벤치마크로 정량 측정하는 테스트 계획서입니다. Spark, StarRocks, OLake, Kafka CDC 파이프라인을 비교 검증합니다.
OLake PoC: Kafka 없이 구현하는 PostgreSQL → Apache Iceberg 실시간 CDC Kafka 없이 PostgreSQL에서 Apache Iceberg로 직접 CDC를 수행하는 경량 도구 OLake를 로컬 Docker 환경에서 구축하고, Debezium과 비교하여 성능·안정성·사용 편의성을 테스트한 PoC 과정을 정리합니다.
RKE2 CNI 성능 비교: Canal vs Cilium - 데이터 중심 워크로드를 위한 최적 선택 RKE2 환경에서 기본 CNI 대신 Cilium을 적용하는 방법과 이점을 다룹니다. Cilium의 eBPF 기술을 활용하여 기존 iptables의 성능 한계를 극복하고, 강력한 보안 정책 및 네트워크 가시성을 확보하는 과정을 설명합니다. RKE2 설치 시 HelmChartConfig를 통한 Cilium 설정 및 커스터마이징 실무 가이드를 제공합니다.
GLiNER 모델은 무엇인가? (범용 LLM vs GLiNER) 최근 데이터 처리 기술이 급격히 발전하면서, 단순히 텍스트를 넘어 방대한 문서에서 필요한 '팩트(Fact)'만 정확하게 구조화하는 기술의 중요성이 커집니다. 오늘은 그 중심에 있는 GLiNER 모델에 대해 알아보고, 우리가 흔히 아는 범용 LLM(GPT, Claude 등)과 어떤 차이가 있는지 정리해 보겠습니다.
데이터는 많은데 왜 쓸 수 없을까? - The Modern Data Report 2026 핵심 분석 'The Modern Data Report 2026'은 기업들이 데이터 플랫폼에 막대한 투자를 했음에도 실제 활용에 실패하는 '데이터 활성화 격차'를 지적합니다. 89%가 데이터 찾기에 시간을 낭비하고, 93%가 상충되는 지표를 경험하며, 68%는 데이터가 AI 활용에 부적합하다고 답했습니다. 해결책은 더 많은 도구가 아닌 '통합된 플랫폼'입니다. 통합 접근(84%), 강력한 거버넌스(81%), 셀프서비스(72%)가 핵심 요소로 꼽혔습니다. 신뢰할 수 있는 데이터로 의사결정 속도를 높이는 것이 2026년의 목표입니다.
Apache Flink를 활용한 API Gateway 실시간 로그 분석 파이프라인 최적화 Apache Flink를 활용하여 Kafka 메시지를 사전 가공함으로써 StarRocks 쿼리 부하를 90% 절감하고 대시보드 응답 속도를 70% 개선한 실시간 로그 분석 파이프라인 최적화 사례