구글, 비용과 성능을 균형 잡은 Gemini 2.5 Flash 모델 공개: Hybrid 추론 기능과 생각 제어 기능 탑재
구글이 Gemini 2.5 Flash 모델을 공개했습니다. 이 모델은 speed, cost, performance 사이에서 최적의 균형을 맞추도록 설계되었으며, hybrid reasoning 기능을 지원하는 첫 번째 모델입니다. 개발자들은 thinking_budget 파라미터를 통해 추론 과정의 세부 제어가 가능하며, 이는 복잡한 작업에 대한 정확성과 효율성을 개선합니다.
Gemini 2.5 Flash는 2.0 Flash 대비 비용과 지연 시간을 줄이면서 성능을 향상시키는 것이 특징입니다. 예를 들어, 복잡한 수학 문제 해결이나 논리적 추론이 필요한 작업에서는 thinking 기능을 활성화해 정확성을 높일 수 있고, 단순 작업에서는 thinking budget을 0으로 설정해 최소 비용으로 처리할 수 있습니다.
이 모델은 현재 Gemini API를 통해 구글 AI 스튜디오, Vertex AI에서 사전 버전으로 이용 가능하며, 개발자 문서와 예제 코드는 Gemini Cookbook에서 확인할 수 있습니다. 공식 출시 전 추가 개선이 이어지며, 성능-비용 효율성 측면에서 주목할만한 업데이트입니다.
Upvoted! Thank you for supporting witness @jswit.