1. Cogito-v1
개요
- AI 스타트업 Deep Cogito가 2025년 4월에 공개한 오픈소스 LLM 시리즈
- Backbone : Meta의 LLaMA와 Alibaba의 Qwen
- 독자적인 학습 전략인 IDA(Iterative Distillation and Amplification)를 통해 훈련
- Cogito v1은 반복적인 자기 반성을 통해 성능 개선
특징
- 하이브리드 추론 모델 : 표준모드와 추론모드를 지원. 표준모드는 빠른 응답 제공, 추론 모드는 내부적인 자기 반성을 통해 정교한 답변 생성
- IDA 학습 전략 : 모델이 더 복잡한 계산을 통해 향상된 응답 생성. 이를 다시 파라미터에 내재화하는 과정을 반복하며 성능을 향상시키는 방법.
- 광범위한 언어 지원 : 30개 이상의 언어로 훈련
- 코딩 및 도구 호출 최적화 : 코딩, 함수 호출, 에이전트 기반 작업에 최적화
2. Gemini 2.5 Flash
개요
- Google이 AI studio와 Vertex AI 플랫폼을 통해 제공하는 하이브리드 추론 모델
- 빠른 속도, 낮은 비용, 향상된 추론 능력
특징
- 사용자가 thinking 모드를 켜거나 끌 수 있음
- 사용자가 직접 thinking_budget 설정을 통해 품질, 비용, 지연시간 간 균형 설정 가능
3. Hunyuan-T1
개요
- Tencent가 개발한 LLM
- 깊은 추론능력과 효율적인 장문 처리
특징
- 하이브리드 아키텍처 : Hybrid-Transformer-Mamba Mixture of Experts 구조 채택
- 강화학습 기반 최적화 : 전체 훈련의 96.7%를 강화학습
- 장문 처리 능력 : TurboS 기반의 긴 문맥 처리 능력 → 긴 문서에서도 일관된 응답 제공
댓글남기기