link 세부 정보
정보 바로가기 : 문샷, 딥시크 이어 긴 컨텍스트 효율 향상 기술 공개..."토큰 처리에 Mo...
문샷, 딥시크 이어 긴 컨텍스트 효율 향상 기술 공개..."토큰 처리에 Mo...[카테고리 설정이 아직되어 있지 않습니다.]
이번 방식은 토큰 처리에 '전문가 혼합(MoE)' 방식의 원리를 적용했다는 점에서 관심을 끌고 있다. 문샷 AI와 칭화대학교, 저장대학교 연구진은 18일 '블록 어텐션 혼합(MoBA, Mixture of Block Attention)'이라는 논문을 온라인...