Generative AI
Use xAI Grok 4 Fast in OCI Generative AI
업데이트 내용
xAI의 대표 모델 Grok 4의 속도/비용 최적화 버전인 Grok 4 Fast가 GA로 제공됩니다. 빠른 첫 토큰 지연과 높은 출력 속도를 제공하여 실시간 애플리케이션에 적합합니다.
핵심 포인트:
- Grok 4 대비 더 빠른 응답 시작 및 토큰 생성 속도
- 비용 효율성 향상으로 대량/실시간 처리 워크로드에 적합
제공 리전(온디맨드)
- US East (Ashburn)
- US Midwest (Chicago)
- US West (Phoenix)
자세한 모델 특성과 리전은 문서 참고.
Use Google Gemini 2.5 in OCI Generative AI
업데이트 내용
OCI Generative AI의 Google Vertex AI 플랫폼이 GA로 제공되며, Gemini 2.5 Pro / Flash / Flash-Lite 모델을 지원합니다.
Gemini 2.5 특징 요약:
- 고급 멀티모달 추론(텍스트/이미지 등)
- 향상된 사고 체인 기반 문제 해결
- 모델군 별 성능/지연 특성: Pro(정확도), Flash/Flash-Lite(속도/비용)
접속 권한은 Oracle 담당자 문의. 모델 상세는 문서 참고.
Highlights:
- 현재 플래그십 모델 지원: Gemini 2.5 Pro, Gemini 2.5 Flash, Gemini 2.5 Flash‑Lite
- GCP Vertex AI Gemini REST API 호환 지원
- OCI Generative AI 온디맨드 서빙 전용 지원(구글 Vertex AI Dynamic Quota 활용)
- 멀티모달: 텍스트/코드/이미지 입력 → 텍스트 출력만 제공
- 멀티모달(API 전용): 비디오/오디오 입력 → 텍스트 출력만 제공
- 제공 리전: US East(Ashburn) – Oracle Interconnect로 Google Cloud 연결, 미국 내 데이터 로컬라이제이션
- 제공 리전: US Midwest(Chicago), US West(Phoenix) – 퍼블릭 인터넷 통해 Google Cloud 연결, 미국 내 데이터 로컬라이제이션
- 접근 방식: OCI Generative AI 콘솔 플레이그라운드, 범용 챗 SDK, CLI
- Zero Data Retention(데이터 미보관) 시나리오 지원
- Gemini 모델에 대한 Oracle 엔터프라이즈 지원 제공
Use Grok Code Fast 1 in OCI Generative AI
업데이트 내용
고빈도 코딩 작업(디버깅/편집 등)과 에이전틱 코딩 워크플로우에 특화된 Grok Code Fast 1이 GA로 제공됩니다.
주요 특징:
- 반복적 수정/리팩토링/디버깅 작업에 최적화
- 에이전트 기반 개발 흐름을 고려한 도구 사용 설계
- 지원 리전/자세한 사양은 문서 참고
이 글은 개인적으로 얻은 지식과 경험을 작성한 글로 내용에 오류가 있을 수 있습니다. 또한 글 속의 의견은 개인적인 의견으로 특정 회사를 대변하지 않습니다.
Younghwan Cho RELEASE-NOTES-2025-AIML
oci-release-notes-2025 Oct-2025 AI/ML Gen AI