NeMo Framework를 활용한 LLM 파인튜닝과 SQuAD 평가 실습 NVIDIA NeMo Framework로 LLaMA 3 8B 모델을 LoRA 기반 PEFT 튜닝하고 SQuAD 데이터셋으로 평가하는 실습 가이드를 소개합니다. 실험 결과 Base 모델 대비 LoRA 모델의 Exact Match가 81%나 향상되어, 기업용 QA 모델 구축에 실질적인 인사이트를 제공합니다.
NeMo Framework와 NeMo Microservices 개요 대규모 AI 모델 개발부터 배포까지 모든 과정을 지원하는 NVIDIA NeMo 플랫폼의 완전 가이드를 소개합니다. 연구용 NeMo Framework와 엔터프라이즈용 NeMo Microservices의 차이점과 파스업DIP에서의 실제 활용 방법을 알아보세요.
파스업DIP로 구현하는 현대적 데이터 파이프라인: 프레임워크 적용과 ELT모니터링 대시보드 #4 파스업DIP 개발팀의 spark-batch 프레임워크를 활용해 개발 생산성 50% 향상과 ELT 모니터링 대시보드 구축을 소개합니다. 순수 라이브러리 대비 코드 복잡도 현저히 감소하고 Apache Superset 기반 실시간 운영 모니터링 체계를 구현했습니다.
파스업, 데이터플랫폼 DIP ‘엄지 척’ 파스업의 데이터 인텔리전스 플랫폼 DIP가 국내 최고 소프트웨어 품질인증 GS 1등급을 획득했습니다. 하루 4억건, 누적 760억건 이상 실시간 처리하며 금융·공공기관에서 입증된 안정성과 성능을 자랑합니다.
파스업DIP로 구현하는 현대적 데이터 파이프라인: 지하철 이용자 통계 분석 프로젝트 #3 서울시 지하철 10여 년간의 승하차 데이터를 현대적 데이터레이크 기술 스택으로 처리한 도시 교통 패턴 분석 프로젝트를 소개합니다. 73,692개 레코드를 Delta Lake와 Apache Superset으로 변환하여 출퇴근 러시아워와 환승역 허브 효과를 시각화했습니다.
파스업DIP로 구현하는 현대적 데이터 파이프라인: 지하철 이용자 통계 분석 프로젝트 #2 Jupyter Notebook 개발 환경에서 Airflow 운영 환경으로 전환한 지하철 데이터 파이프라인 자동화 프로젝트를 소개합니다. Kubernetes Secret 활용한 보안 강화와 Spark Kubernetes Operator를 통한 스케줄링 기반 워크플로우 구축을 구현했습니다.
파스업DIP로 구현하는 현대적 데이터 파이프라인: 지하철 이용자 통계 분석 프로젝트 #1 파스업 DIP(Data Intelligence Platform)를 활용해 Spark, Delta Lake, Superset 등으로 서울 지하철 이용자 통계 데이터를 전처리·시각화해 교통·상권·도시계획 인사이트를 도출한 프로젝트를 소개합니다.
구글의 Open Lakehouse 혁신과 기업 데이터 전략에 미치는 영향 원문: Extending the Google Data Cloud lakehouse architecture (Google Cloud Blog, 2025) 구글이 AI 기반 Open Lakehouse 아키텍처의 대규모 업데이트를 발표했습니다. 이번 발표는 개방성, 통합성, 고성능을 핵심으로 하며, Apache Iceberg를 중심으로 한 진정한 멀티엔진 상호 운용성 구현에 중점을 두고 있습니다. 핵심 혁신 기술 BigLake Iceberg 네이티브 스토리지 Apache Iceberg 오픈
2025년, 당신의 비즈니스를 성장시킬 10대 핵심 기술 트렌드 안녕하세요, 파스업 독자 여러분! 오늘은 세계적인 리서치 기관 포레스터(Forrester Research)가 발표한 2025년 주목해야 할 10대 신흥 기술에 대해 알아보려고 합니다. 기술은 빠르게 진화하고 있으며, 이러한 변화 속에서 경쟁력을 유지하기 위해서는 어떤 기술이 비즈니스에 가치를 가져올지 미리 파악하는 것이 중요합니다. 기술 혜택 시점에 따른 분류 포레스터는 이번 분석에서 각