[Google I/O 최신 소식] 구글 제미나이 업데이트
구글은 지난 14일 미 캘리포니아주 마운틴뷰에서 열린 ’구글 연례 개발자 회의(I/O)’에서 Gemini에 대한 업데이트를 발표하였습니다. 속도와 효율성을 위한 경량 모델인 제미나이 1.5 플래시(Gemini 1.5 Flash)와 차세대 개방형 모델인 Gemma 2를 발표하고, 새로운 AI 비서 ‘프로젝트 아스트라(Project Astra)를 공개하였습니다.
속도와 효율성에 최적화된 1.5 플래시
작년 12월 구글은 Ultra, Pro 및 Nano의 세 가지 크기로 최초의 기본 다중 모드 모델 인 Gemini 1.0을 출시했습니다. 불과 몇 달 후 우리는 향상된 성능과 100만 개의 토큰이라는 획기적인 긴 컨텍스트 창을 갖춘 1.5 Pro를 출시했습니다.
구글은 사용자 피드백을 통해 일부 애플리케이션에는 더 짧은 대기 시간과 더 낮은 서비스 비용이 필요하다는 것을 확인하였습니다. 이로 인해 1.5 Pro보다 가볍고 대규모 서비스를 제공할 수 있도록 빠르고 효율적으로 설계된 모델인 Gemini 1.5 Flash를 소개하게 되었습니다 .
1.5 Flash는 Gemini 모델 제품군에 가장 최근에 추가된 것이며 API 에서 제공되는 가장 빠른 Gemini 모델입니다 . 대규모, 빈도가 높은 작업에 최적화되어 있으며 비용 효율적으로 서비스를 제공하고 획기적인 긴 컨텍스트 창을 제공합니다.
1.5 Pro보다 가벼운 모델이지만 방대한 양의 정보에 대한 다중 모드 추론 능력이 뛰어나고 크기에 비해 인상적인 품질을 제공합니다.
구글은 사용자 피드백을 통해 일부 애플리케이션에는 더 짧은 대기 시간과 더 낮은 서비스 비용이 필요하다는 것을 확인하였습니다. 이로 인해 1.5 Pro보다 가볍고 대규모 서비스를 제공할 수 있도록 빠르고 효율적으로 설계된 모델인 Gemini 1.5 Flash를 소개하게 되었습니다 .
1.5 Flash는 Gemini 모델 제품군에 가장 최근에 추가된 것이며 API 에서 제공되는 가장 빠른 Gemini 모델입니다 . 대규모, 빈도가 높은 작업에 최적화되어 있으며 비용 효율적으로 서비스를 제공하고 획기적인 긴 컨텍스트 창을 제공합니다.
1.5 Pro보다 가벼운 모델이지만 방대한 양의 정보에 대한 다중 모드 추론 능력이 뛰어나고 크기에 비해 인상적인 품질을 제공합니다.
차세대 개방형 모델 젬마 2
구글은 Gemini 모델을 만드는 데 사용된 것과 동일한 연구 및 기술로 제작된 개방형 모델 제품군인 Gemma 에 대한 일련의 업데이트도 공유하였습니다.
책임감 있는 AI 혁신을 위한 차세대 개방형 모델인 Gemma 2를 발표하였습니다. Gemma 2는 획기적인 성능과 효율성을 위해 설계된 새로운 아키텍처를 갖추고 있으며 새로운 크기로 제공될 예정입니다.
Gemma 제품군은 PaLI-3 에서 영감을 받은 최초의 비전 언어 모델인 PaliGemma 로 확장되고 있습니다 . 그리고 모델 응답의 품질을 평가하기 위해 Responsible Generative AI Toolkit을 LLM Comparator 로 업그레이드했습니다 .
책임감 있는 AI 혁신을 위한 차세대 개방형 모델인 Gemma 2를 발표하였습니다. Gemma 2는 획기적인 성능과 효율성을 위해 설계된 새로운 아키텍처를 갖추고 있으며 새로운 크기로 제공될 예정입니다.
Gemma 제품군은 PaLI-3 에서 영감을 받은 최초의 비전 언어 모델인 PaliGemma 로 확장되고 있습니다 . 그리고 모델 응답의 품질을 평가하기 위해 Responsible Generative AI Toolkit을 LLM Comparator 로 업그레이드했습니다 .
범용 AI 에이전트 개발 진행, 프로젝트 아스트라
인류에게 도움이 되는 책임감 있는 AI 구축이라는 Google DeepMind 사명의 일환으로 일상 생활에 도움이 될 수 있는 범용 AI 에이전트를 개발하고자 하였습니다. 그래서 그들은 Project Astra (고급 보고 말하는 반응형 에이전트)를 통해 AI 비서의 미래를 구축하는 진행 상황을 공유하고 있습니다.
진정으로 유용하려면 에이전트는 사람들처럼 복잡하고 역동적인 세계를 이해하고 대응해야 하며, 보고 듣는 내용을 받아들이고 기억하여 상황을 이해하고 조치를 취해야 합니다. 또한 사용자가 지체나 지체 없이 자연스럽게 대화할 수 있도록 적극적이고 교육 가능하며 개인적이어야 합니다.
다중 모드 정보를 이해할 수 있는 AI 시스템을 개발하는 데 놀라운 진전을 이루었지만 응답 시간을 대화 수준으로 낮추는 것은 어려운 엔지니어링 과제입니다. 지난 몇 년 동안 구글은 모델이 인식하고, 추론하고, 대화하는 방식을 개선하여 상호 작용의 속도와 품질이 더욱 자연스럽게 느껴지도록 노력해 왔습니다.
‘아스트라’는 구글의 생성형 AI ’제미나이(Gemini)’의 최신 버전으로 구동되는 멀티모달 AI입니다. 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터를 종합적으로 처리하여 명령을 수행하며, 스마트폰 카메라를 통해 보이는 사물을 분석해 음성 명령에 응답하는 기능을 제공합니다.
진정으로 유용하려면 에이전트는 사람들처럼 복잡하고 역동적인 세계를 이해하고 대응해야 하며, 보고 듣는 내용을 받아들이고 기억하여 상황을 이해하고 조치를 취해야 합니다. 또한 사용자가 지체나 지체 없이 자연스럽게 대화할 수 있도록 적극적이고 교육 가능하며 개인적이어야 합니다.
다중 모드 정보를 이해할 수 있는 AI 시스템을 개발하는 데 놀라운 진전을 이루었지만 응답 시간을 대화 수준으로 낮추는 것은 어려운 엔지니어링 과제입니다. 지난 몇 년 동안 구글은 모델이 인식하고, 추론하고, 대화하는 방식을 개선하여 상호 작용의 속도와 품질이 더욱 자연스럽게 느껴지도록 노력해 왔습니다.
‘아스트라’는 구글의 생성형 AI ’제미나이(Gemini)’의 최신 버전으로 구동되는 멀티모달 AI입니다. 텍스트, 이미지, 오디오, 비디오 등 다양한 데이터를 종합적으로 처리하여 명령을 수행하며, 스마트폰 카메라를 통해 보이는 사물을 분석해 음성 명령에 응답하는 기능을 제공합니다.
본 데모에서는 아스트라가 질문에 맞는 물건을 찾고, 물건을 식별하여 용도를 설명하였으며, 작성된 코드를 검토하고, 위치와 주변을 안내 해주었으며 잃어버린 물건을 찾아주는 등 자연스러운 대화 방식으로 동작하는 모습을 확인할 수 있습니다.
그 외 Google I/O 2024에서 발표한 AI에 관한 사항이 더 궁금하다면 해당 링크를 통해 확인할 수 있습니다.
그 외 Google I/O 2024에서 발표한 AI에 관한 사항이 더 궁금하다면 해당 링크를 통해 확인할 수 있습니다.
구글 클라우드 프리미어 파트너, 클루커스
클루커스는 구글 클라우드 파트너의 가장 높은 레벨인 구글 클라우드 프리미어 파트너사로, 구글 클라우드 기반 종합적인 클라우드 서비스를 제공합니다. 특히 클루커스는 숙련된 Data & AI 전문가 그룹를 통하여 최근 각광받고 있는 생성형 AI 기술을 빠르게 습득하고 있습니다. 생성형 AI 도입과 관련하여 전문가의 상담이 필요하시다면 아래 버튼을 통해 전문가 컨설팅을 신청하세요!
클라우드 기반의 데이터 및 인공지능 서비스 컨설팅이 필요하다면
클루커스에 문의하세요!
클루커스에 문의하세요!