[YouTube 요약] Gemini 실습: 멀티모달 AI와 상호작용

Gemini는 텍스트, 이미지, 오디오, 동영상, 코드에서 추론이 가능한 네이티브 멀티모달 AI입니다. 이 동영상에서는 Gemini와의 흥미로운 상호작용을 간략히 보여줍니다. 링크: https://youtu.be/UIZAiXYceBI?si=zJH_mk6T6nw2hjFe

타임라인 - Gemini 실습: 멀티모달 AI와 상호 작용하기

00:00:02 Gemini AI 모델을 테스트, 상호작용의 예시들 확인
00:01:15 고무 오리가 바다에서 뜰까, 오리의 이름이 무엇인지, 바다 한가운데 있는 오리의 서식은 어렵다.
00:02:03 게임 참가자가 단서를 보고 대상을 맞추는 게임.
00:04:08 오리는 친구를 만나러 가는 게 현명한 선택.  중요하지 않은 정보를 담은 예시들.
00:05:23 ️매트릭스 영화 총알피하기 장면 & 고양이 운동 신경과 쌍둥이자리 별자리 그림 설명.

요약 - Gemini 실습: 멀티모달 AI와 상호 작용하기

Gemini AI 모델 테스트, 상호작용 확인

Gemini AI 모델을 테스트하고 이를 영상으로 촬영하여 성능을 확인하였습니다.

Gemini는 일련의 이미지를 보여준 후 이미지 내 무엇을 보이는지 추론합니다.

상호작용의 예시 중 "파란색 오리"를 인식하고 추론하는 과정이 담겨있습니다.

마지막으로는 손에 "파란색 오리"가 나타나며 가능성이 드물지만 이러한 결과도 나올 수 있다는 것을 확인하였습니다.

고무오리는 바다에서 떠 있을까?

밀도가 낮은 고무 오리는 물에 뜰 것으로 예상돼요.

고무나 플라스틱으로 만들어진 오리일 가능성이 높아요.

중국어에서는 '야즈'라고 하며, 1성으로 발음한다는데 다른 언어의 '오리'도 알아봤어요.

그리고 바다 한가운데 있는 오리가 육지 근처에 없으면 쉬거나 먹이를 찾기 어려울거에요.

이모티콘을 활용한 놀이/게임은?

이모티콘을 사용한 국가 맞히기 게임이에요.

게임 참가자는 단서를 보면서 대상을 맞춰서 참여도를 유도하며, 새로운 아이디어를 만들기도 해요.

색상, 음식, 동물, 그리고 이모티콘을 활용해서 게임을 즐길 수 있는데, 게임을 하면서 많이 웃을 수 있다는 장점이 있어요.

🦆친구를 만나러 가는 게 현명한 선택?

오리는 왼쪽으로 가면 친구를, 오른쪽으로 가면 곰을 만난다고 해요.

그래서 친구가 더 나으니 왼쪽으로 가기로 선택했다고 하네요.

또 사진에서는 태양, 지구, 토성의 순서가 맞지만 디자인적으로 봤을 때, 오른쪽에 있는 자동차가 공기 역학적이라 더 빠른 모습을 보여준대요.

게임에서는 중요하지 않은 정보를 주기도 하는데, '야호'라는 말로 좋은 소식을 전하며 전자 기타로 만들어진 헤어메탈 밴드를 설명하는데 남다른 예입니다.

마지막으로 그림에는 야자수가 추가되었다고 해요.

매트릭스 총알피하기와 고양이 운동신경

'매트릭스' 영화의 '총알 피하기' 장면을 따라한 영상에서 고양이가 시도했으나 실패했어요.

하지만 걱정은 필요없어요.

고양이는 운동 신경이 좋아 다시 벽을 올라옵니다.

이어서 프롬프트 기술을 예로 들어서 Gemini로 무엇을 할 수 있는지 소개하고 있답니다.



댓글

이 블로그의 인기 게시물

[AI] AI 개발 능력보다 중요한 AI 활용 능력: 삶을 윤택하게.

단타를 해야하는 이유

일봉의 변화 과정