[YouTube 요약] Gemini 실습: 멀티모달 AI와 상호작용
Gemini는 텍스트, 이미지, 오디오, 동영상, 코드에서 추론이 가능한 네이티브 멀티모달 AI입니다. 이 동영상에서는 Gemini와의 흥미로운 상호작용을 간략히 보여줍니다. 링크: https://youtu.be/UIZAiXYceBI?si=zJH_mk6T6nw2hjFe
타임라인 - Gemini 실습: 멀티모달 AI와 상호 작용하기
00:00:02 Gemini AI 모델을 테스트, 상호작용의 예시들 확인00:01:15 고무 오리가 바다에서 뜰까, 오리의 이름이 무엇인지, 바다 한가운데 있는 오리의 서식은 어렵다.
00:02:03 게임 참가자가 단서를 보고 대상을 맞추는 게임.
00:04:08 오리는 친구를 만나러 가는 게 현명한 선택. 중요하지 않은 정보를 담은 예시들.
00:05:23 ️매트릭스 영화 총알피하기 장면 & 고양이 운동 신경과 쌍둥이자리 별자리 그림 설명.
요약 - Gemini 실습: 멀티모달 AI와 상호 작용하기
![](https://resource.lilys.ai/thumbnails/UIZAiXYceBI/2.jpg)
Gemini AI 모델을 테스트하고 이를 영상으로 촬영하여 성능을 확인하였습니다.
Gemini는 일련의 이미지를 보여준 후 이미지 내 무엇을 보이는지 추론합니다.
상호작용의 예시 중 "파란색 오리"를 인식하고 추론하는 과정이 담겨있습니다.
마지막으로는 손에 "파란색 오리"가 나타나며 가능성이 드물지만 이러한 결과도 나올 수 있다는 것을 확인하였습니다.
![](https://resource.lilys.ai/thumbnails/UIZAiXYceBI/75.jpg)
밀도가 낮은 고무 오리는 물에 뜰 것으로 예상돼요.
고무나 플라스틱으로 만들어진 오리일 가능성이 높아요.
중국어에서는 '야즈'라고 하며, 1성으로 발음한다는데 다른 언어의 '오리'도 알아봤어요.
그리고 바다 한가운데 있는 오리가 육지 근처에 없으면 쉬거나 먹이를 찾기 어려울거에요.
![](https://resource.lilys.ai/thumbnails/UIZAiXYceBI/123.jpg)
이모티콘을 사용한 국가 맞히기 게임이에요.
게임 참가자는 단서를 보면서 대상을 맞춰서 참여도를 유도하며, 새로운 아이디어를 만들기도 해요.
색상, 음식, 동물, 그리고 이모티콘을 활용해서 게임을 즐길 수 있는데, 게임을 하면서 많이 웃을 수 있다는 장점이 있어요.
![](https://resource.lilys.ai/thumbnails/UIZAiXYceBI/248.jpg)
오리는 왼쪽으로 가면 친구를, 오른쪽으로 가면 곰을 만난다고 해요.
그래서 친구가 더 나으니 왼쪽으로 가기로 선택했다고 하네요.
또 사진에서는 태양, 지구, 토성의 순서가 맞지만 디자인적으로 봤을 때, 오른쪽에 있는 자동차가 공기 역학적이라 더 빠른 모습을 보여준대요.
게임에서는 중요하지 않은 정보를 주기도 하는데, '야호'라는 말로 좋은 소식을 전하며 전자 기타로 만들어진 헤어메탈 밴드를 설명하는데 남다른 예입니다.
마지막으로 그림에는 야자수가 추가되었다고 해요.
![](https://resource.lilys.ai/thumbnails/UIZAiXYceBI/323.jpg)
'매트릭스' 영화의 '총알 피하기' 장면을 따라한 영상에서 고양이가 시도했으나 실패했어요.
하지만 걱정은 필요없어요.
고양이는 운동 신경이 좋아 다시 벽을 올라옵니다.
이어서 프롬프트 기술을 예로 들어서 Gemini로 무엇을 할 수 있는지 소개하고 있답니다.
댓글
댓글 쓰기