Home

/

Programming

/

Llm

/

Rag

/

Project

/

[LLM] Mercury Coder

[LLM] Mercury Coder

2025-07-25 최대 1 분 소요

개요

회사 : Inception Labs
모델 : Mercury Coder
날짜 : 2025년 2월 19일

작동 원리

Auto Regressive 방식의 언어모델은 텍스트를 왼쪽에서 오른쪽으로 한 토큰씩 순차적으로 생성
Diffusion 모델은 초기에 노이즈가 있는 상태에서 점진적으로 노이즈를 제거하며 전체 텍스트를 동시에 생성
corse-to-fine 생성 과정은 이전 출력에 의존하지 않고 텍스트를 생성

특징

엔비디아 H100 GPU에서 초당 1000개 이상의 토큰 생성하며, 기존의 모델 대비 10배 빠름
Mercury Coder는 코드 생성에 최적화된 모델로, GPT-4o mini, Claude 3.5 Haiku같은 모델을 능가
메모리 효율성이 좋아 비용 절감

공유하기

Twitter Facebook LinkedIn

댓글남기기

참고

[LLM] Self-RAG : Learning To Retrieve, Generate, and Critique Through Self-Reflection

2025-07-25 1 분 소요

Self-RAG

[llm] 파인튜닝 기법

2025-07-25 6 분 소요

layout: single title: "[LLM] 해부학 PDF 질의응답 RAG W17-20" categories: [Programming, LLM, RAG, Project] tag: [Programming, LLM, RAG, Project] toc: true author_pr...

[LLM] MCP(Model Context Protocol)

2025-07-25 1 분 소요

개요

[LLM] 자동차 메뉴얼 질의응답 RAG W9-12

2025-07-25 18 분 소요

W9