OCI Generative AI의 xAI 플랫폼에서 사전 학습된 Grok 4 모델을 공식적으로 지원합니다. Grok 4는 자연어, 수학, 추론에서 높은 성능을 제공하며, 네이티브 툴 사용과 기업용 활용(데이터 추출, 코딩, 요약 등)에 강점을 보입니다.
핵심 포인트:
제공 모델과 리전: 사전 학습 기반 모델
온디맨드 서빙 모드 모델에 대해 최신 버전으로 자동 라우팅되는 모델 별칭을 지원합니다. 실험/테스트에 유용하며, 클라이언트 코드 변경 없이 최신 버전을 사용할 수 있어 운영 부담을 줄입니다.
제공 별칭 예시
cohere.command-latest
→ cohere.command-r-08-2024
cohere.command-plus-latest
→ cohere.command-r-plus-08-2024
사용 방법
-latest
접미사가 있는 모델 선택model_id = "cohere.command-latest"
)사용 가능 리전 (대상 모델의 온디맨드 모드가 제공되는 리전)
콘솔 경고, API 응답 헤더(model-retirement-info
) 및 OCI 공지 구독을 통해 모델 폐기/retirement 일정을 안내합니다. 상세 일정은 GetModel
API로 확인 가능하며, 다음 속성을 제공합니다: timeDeprecated
, timeOnDemandRetired
, timeDedicatedRetired
.
공지 구독 권장: 온디맨드 14/7일 전, 전용 모드 90/60/30/7일 전에 안내됩니다.
텍스트 또는 이미지를 단일 페이로드로 입력해 임베딩을 생성합니다(동시 입력 불가). 콘솔 입력은 512 토큰 미만, 실행당 최대 96개 입력을 권장하며, API/SDK에서는 실행당 총 128,000 토큰까지 처리할 수 있습니다. 출력 벡터 크기는 1,536차원입니다.
자바용 LangChain인 LangChain4j에서 OCI Generative AI 모델을 지원합니다.
관련 자료
modelId
에 사용할 사전 학습 모델(예: Cohere Command 계열, xAI Grok 계열 등)을 지정합니다.~/.oci/config
(프로파일) 또는 환경 변수, OCI 환경은 인스턴스 기반 인증/리소스 기반 인증을 활용합니다.예시 코드(개념적):
// Gradle/Maven 의존성은 README 참고
// GitHub: https://github.com/langchain4j/langchain4j-community/tree/main/models/langchain4j-community-oci-genai
import dev.langchain4j.model.chat.ChatLanguageModel;
// 실제 클래스/빌더 명은 README의 최신 예제를 참고하세요
ChatLanguageModel model = OciGenerativeAiChatModel.builder()
.endpoint("https://inference.generativeai.us-chicago-1.oci.oraclecloud.com")
.compartmentId("ocid1.compartment.oc1......")
.modelId("cohere.command-r-08-2024") // 또는 xAI Grok 계열 등 사용 모델 ID
.temperature(0.3)
.maxTokens(1024)
.build();
String answer = model.generate("제품 A의 요약을 작성해 주세요.");
설정 팁:
-latest
)을 사용해 클라이언트 재배포 없이 최신 버전으로 전환할 수 있습니다.OCI Generative AI가 US West (Phoenix) 리전에서 제공됩니다.
Natural TTS 모델이 다음 9개 언어를 지원합니다: 영어(미국/영국), 스페인어, 포르투갈어(브라질), 프랑스어, 이탈리아어, 힌디어, 일본어, 중국어(표준어). 서비스는 US West (Phoenix) 상용 리전에서 제공됩니다. 자세한 리전은 문서를 참고하세요.
이 글은 개인적으로 얻은 지식과 경험을 작성한 글로 내용에 오류가 있을 수 있습니다. 또한 글 속의 의견은 개인적인 의견으로 특정 회사를 대변하지 않습니다.
Younghwan Cho RELEASE-NOTES-2025-AIML
oci-release-notes-2025 Jul-2025 AI/ML Gen AI