link 세부 정보
정보 바로가기 : 텐센트, '딥시크-R1'보다 빠른 추론 모델 출시..."1초 만에 답변"
텐센트, '딥시크-R1'보다 빠른 추론 모델 출시..."1초 만에 답변"[카테고리 설정이 아직되어 있지 않습니다.]
여기에 '전문가 혼합(MoE)' 모델을 적용, 필요한 일부 매개변수만 활성화하는 방식으로 연산 효율을 높였다.... 알리바바는 지난달 28일 전문가 혼합(MoE) 방식을 활용한 '큐원2.5-맥스'를 공개하며, '딥시크-V3'의 성능을...