link 세부 정보
정보 바로가기 : 딥시크, V3·R1의 '행렬곱셈' 최적화 라이브러리 공개
딥시크, V3·R1의 '행렬곱셈' 최적화 라이브러리 공개[카테고리 설정이 아직되어 있지 않습니다.]
특히, 표준 그룹의 GEMM은 물론, V3에 활용한 전문가 혼합(MoE)을 모두 지원한다. 이 라이브러리는... 엔비디아 'H800' GPU에서 테스트한 결과, 딥GEMM은 일반적인 GEMM 작업에서 1.4~2.7배, MoE를 위한 GEMM의 작업에서 1.1...