link 세부 정보
정보 바로가기 : 사람처럼 인식·추론·기억을 동시에 처리하는 오픈 소스 LMM 등장
사람처럼 인식·추론·기억을 동시에 처리하는 오픈 소스 LMM 등장[카테고리 설정이 아직되어 있지 않습니다.]
영어 벤치마크인 라브리스피치(LibriSpeech)에서는 깨끗한 데이터셋에서 2.5%, 소음 환경에서 9.2%의 WER을 기록했다. 비디오 처리에서는 주제 추론과 이상 탐지에서 뛰어난 성과를 보였으며, MLVU에서 66.2...