AWS HealthOmics Run Analyzer 분석 리포트
AWS HealthOmics Run Analyzer 분석 리포트
Run ID: 1910249 | Region: us-east-1 | 분석일: 2026-01-07
1. 워크플로우 개요
2. 비용 분석
2.1 전체 비용 요약
2.2 비용 최적화 기회 (주요 태스크)
가장 큰 비용 절감이 가능한 태스크:
3. 리소스 활용률 분석
3.1 전체 Run 리소스 사용률
참고: Run 레벨에서 낮은 활용률은 태스크들이 순차적으로 실행되어 동시 리소스 사용이 적기 때문입니다.
3.2 태스크별 리소스 활용률 (상위 비용 태스크)
GATK4_HAPLOTYPECALLER (가장 비용이 높은 태스크)
GATK4_MARKDUPLICATES
BWAMEM1_MEM (24개 병렬 태스크)
4. 태스크별 상세 분석
4.1 가장 오래 실행된 태스크 (Top 5)
4.2 인스턴스 타입별 태스크 분포
5. 최적화 권장사항
5.1 즉시 적용 가능한 최적화
1. GATK4_HAPLOTYPECALLER 인스턴스 다운사이징 (최우선)
현재: omics.r.2xlarge (8 vCPU, 64 GiB) → $0.284
권장: omics.c.xlarge (4 vCPU, 8 GiB) → $0.096
절감: $0.188 (66% 절감)
- 메모리 사용률이 9.8%로 매우 낮음
- 실제 사용 메모리: 6.25 GiB (64 GiB 중)
2. GATK4_MARKDUPLICATES 인스턴스 변경
현재: omics.m.2xlarge (8 vCPU, 32 GiB) → $0.082
권장: omics.r.xlarge (4 vCPU, 32 GiB) → $0.054
절감: $0.028 (34% 절감)
- 메모리 사용률이 71.4%로 높아 메모리 최적화 인스턴스 유지 필요
3. 일부 BWAMEM1_MEM 태스크 다운사이징
- 2개 태스크에서
omics.c.4xlarge→omics.c.2xlarge가능 - 해당 태스크의 CPU 활용률이 43-48%로 낮음
5.2 Nextflow 최적화 설정 생성
최적화된 설정 파일을 생성하려면:
AWS_DEFAULT_REGION=us-east-1 python3.11 -m omics.cli.run_analyzer 1910249 --write-config=optimized.config
6. 워크플로우 파이프라인 단계별 시간
PREPARE_INTERVALS ████ (~1분)
FASTQC/FASTP ████████ (~3분)
BWAMEM1_MEM ████████████████ (~4분, 24개 병렬)
MARKDUPLICATES ██████████████████████ (~10분)
BASERECALIBRATOR ██████████████████████████████████████████ (~21분)
APPLYBQSR ████████████████████████████████████████████████ (~24분)
HAPLOTYPECALLER ██████████████████████████████████████████████████ (~25분)
VCF_FILTERING ██████████████ (~7분)
QC/MULTIQC ███ (~1분)
7. 결론
8. 분석 도구 정보
aws-healthomics-tools (GitHub)를 사용하여 분석되었습니다.
pip install aws-healthomics-tools
python -m omics.cli.run_analyzer <RUN_ID> -o output.csv
이 리포트는 Claude Code를 통해 자동 생성되었습니다.