관련 기술
자율주행 솔루션에서의 ML 프레임워크 및 런타임 최적화
- 데이터 형식 변환 및 pre-processing 병렬화, 비동기 파이프라인 구축을 통한 CPU-GPU 간 데이터 전송 최적화 및 병렬화
- post-processing 알고리즘 경량화 및 효율화
- 동적 실행 시간을 고려한 안정성 있는 ML 스케줄링 기법 도입
NPU 기반 엣지 컴퓨팅에서의 컴파일러 최적화
- 기존 GPU에 최적화된 DNN 모델을 엣지 상황에서의 NPU 컴파일링을 위한 최적화 지원
- 연산 결합 및 병렬화를 통해 데이터 재사용 극대화를 이용한 메모리 접근 패턴 최적화 도입
- 엣지 컴퓨팅 구조를 고려한 back-end 최적화 도입
AI 시스템 효율 향상을 위한 공유 자원 관리 기법
- 연산 패턴, 메모리, 대역폭 등 요구 사항을 고려한 컴퓨팅 자원의 시간 · 공간적 자원 공유 최적화 지원
- 애플리케이션 특성에 따른 다양한 수준의 자원 가상화 및 시공간 자원 분할 최적화 지원