Advanced Search
Search Results
81 total results found
Nf-core/Nextflow workflow on AWS Batch
Documentation https://www.nextflow.io/docs/latest/aws.html https://aws.amazon.com/blogs/hpc/leveraging-seqera-platform-on-aws-batch-for-machine-learning-workflows-part-2-of-2/ Nextflow script Your first script https://www.nextflow.io/docs/latest/your-first-...
Troubleshooting for AWS Batch & Nextflow
CannotPullImageManifestError: Error response from daemon: manifest unknown: manifest unknown Solution Check your docker image. bash: aws: command not found Solution Check your container image has the aws cli program. https://www.nextflow.io/...
몇 가지 기능과 알아둘 것들
서비스 Quota와 리전 AWS의 거의 모든 서비스가 그러하듯 HealthOmics에서도 Quota가 존재합니다. 또한 사용 가능한 리전이 현재 제한적입니다. (서울 리전은 사용 불가능) 리전 정보: https://docs.aws.amazon.com/general/latest/gr/healthomics-quotas.html Quota: https://docs.aws.amazon.com/omics/latest/dev/quotas.html Heal...
WDL 워크플로우 마이그레이션 하기 (HiFi-human-WGS-WDL)
다음 문서는 WDL 워크플로우를 HealthOmics의 Private workflow에 등록하는 내용을 다루고 있습니다. 대상 워크플로우 주소: https://github.com/PacificBiosciences/HiFi-human-WGS-WDL 일단 가장 먼저 해볼만한 일은 이 WDL 워크플로우가 로컬에서 잘 동작하는지 확인해보는 일일 것입니다. EC2 인스턴스의 사양 역시 문서 내용을 참고 ( 64 cpu cores and 256 GB of ...
Rstudio 실습환경 자동화 구성
Amazon EC2의 Ubuntu 24버전 기준으로 아래 문서를 작성했습니다. 아래 내용은 시간이 지남에 따라 적절히 작동하지 않을 수 있으므로 필요한대로 수정하고 확인하는 것을 추천드립니다! Amazon EC2의 User data 기능을 사용하기 위해 User Data내용을 파일로 만들어둡니다. 여기 예에서는 install_rstudio.txt라고 파일을 만들었습니다. #!/bin/bash # update indices apt update...
Example code
Python으로 Nextflow 작성하기 import os from textwrap import dedent os.makedirs('workflows/nf/sample', exist_ok=True) nf = dedent(''' nextflow.enable.dsl = 2 params.greeting = 'hello' params.addressee = null if (!params.addressee) exit 1, "required...
Nf-core 워크플로우 마이그레이션 하기 (spatialvi)
2025년 5월 22일 현재 dev 버전 branch에서 테스트 되었습니다. 연구 목적이며 반드시 실제 샘플과 시나리오상에서 개별적으로 결과데이터와 파이프라인 검증을 필요로 할 것입니다. 2025년 5/30일 경 nf-schema 지원을 위한 HealthOmics 업데이트가 예정되어 있습니다. 그전에는 nf-schema를 기존의구 플러그인인 nf-validation으로 변경해야 합니다. 워크플로우 내 코드 수정은 다음을 참고하여 모두 교체해주세요. (링크...
제목 없음
아키텍처 개요
AWS BLAST Performance Testing Architecture Architecture Overview ┌─────────────────────────────────────────────────────────────┐ │ AWS Cloud (ap-northeast-2) ...
비용 분석 (Cost Analysis)
AWS BLAST Performance Testing - Detailed Cost Analysis Region: ap-northeast-2 (Seoul) 1. Amazon EFS (Elastic File System) Costs Storage Configuration Parameter Value File System ID fs-0d2d032d1cca25f3f Name blast-perf-test-efs-nt-db Total Size 254....
EBS 최적화 아키텍처 테스트 결과
AWS BLAST EBS 최적화 아키텍처 테스트 결과 테스트 날짜: 2026-01-02 리전: ap-northeast-2 (Seoul) 요약 EBS Snapshot 기반 아키텍처(r6i.24xlarge + EBS gp3)로 성공적으로 마이그레이션 테스트를 완료했습니다. 핵심 결과 항목 EFS (기존) EBS (신규) 개선 50,000 시퀀스 5m 59s 2m 51s 52% 단축 500,000 시퀀스 25m 9s 21m 49s 13% 단축 J...
EFS vs FSx for Lustre 비교 분석 (실제 테스트 결과 포함)
BLAST 파일 시스템 성능 비교 테스트 1. 테스트 환경 구성 1.1 인프라 설정 EC2 인스턴스 타입: c5n.9xlarge (36 vCPU, 96GB RAM, 50 Gbps 네트워크) AMI: Amazon Linux 2023 배치: 동일 AZ에 FSx/EFS 배치 수량: 2대 (동시 테스트용) 스토리지 FSx for Lustre: Scratch 2, 1.2 TB (1,200 MB/s 처리량) EFS: Max I/O 모드, 버스팅 처리량 둘 다 동일 V...
EBS Snapshot 프로비저닝 성능 분석
EBS Snapshot 기반 프로비저닝 성능 분석 작성일: 2026-01-07 리전: ap-northeast-2 (Seoul) 개요 EBS Snapshot 기반으로 EC2 인스턴스를 프로비저닝할 때 발생하는 Lazy Loading 메커니즘과 BLAST 워크로드에 미치는 영향을 분석합니다. 1. EBS Snapshot 복원 동작 방식 Lazy Loading (기본 동작) ┌─────────────────────────────────────────────────...
AWS HealthOmics Run Analyzer 분석 리포트 (Run: 1910249)
AWS HealthOmics Run Analyzer 분석 리포트 Run ID: 1910249 | Region: us-east-1 | 분석일: 2026-01-07 1. 워크플로우 개요 항목값 워크플로우 이름NA12878_WES (nf-core/sarek) 시작 시간2026-01-06 20:44:04 (UTC) 종료 시간2026-01-06 23:15:32 (UTC) 총 실행 시간2시간 31분 28초 (9,088초) 총 태스크 수48개 2. 비용 분석...
HPP Production Workflows
Human Pangenome Reference Consortium (HPRC) Production Workflows를 AWS 환경에서 구현하기 위한 Solutions Architect 가이드
개요 및 Executive Summary
HPP Production Workflows - AWS 구현 전략 보고서 Executive Summary Human Pangenome Reference Consortium (HPRC) Production Workflows는 차세대 시퀀싱 데이터로부터 고품질 diploid genome assembly를 생성하는 엔터프라이즈급 생물정보학 파이프라인입니다. 본 보고서는 AWS Solutions Architect가 고객의 HPP 워크플로우 클라우드 마이그레이션 및 ...
프로젝트 분석 및 기술 스택
프로젝트 분석 및 기술 스택 1.1 비즈니스 요구사항 HPP Production Workflows는 Human Pangenome Reference Consortium의 핵심 인프라로서 다음과 같은 비즈니스 가치를 제공합니다: 주요 사용자 대규모 시퀀싱 센터 (월 100+ 샘플 처리) 학술 연구기관 (프로젝트 기반 워크로드) 상업적 genomics 플랫폼 (SaaS 서비스 제공) 핵심 성능 지표 처리량: 샘플당 24-48시간 내 완료 정확도: QV 5...
AWS 아키텍처 전략
AWS 아키텍처 전략 2.1 AWS HealthOmics 우선 전략 (권장) 비즈니스 가치: 완전 관리형: 인프라 운영 오버헤드 90% 감소 Genomics 최적화: 생물정보학 워크로드 특화 성능 튜닝 규정 준수: HIPAA, SOC 2 Type II 인증 기본 제공 비용 투명성: 사용량 기반 과금, 예측 가능한 비용 구조 기술적 우위: HealthOmics 특화 기능: - WDL 네이티브 실행 엔진 (Cromwell 대비 20% 성능 향상) - 자동 스케일...