12월, 2023의 게시물 표시

[YouTube 요약] Gemini: Google의 가장 유능한 최신 AI 모델

이미지
  Gemini는 모두에게 더 유용한 AI 모델을 구축하는 여정에서 한 차원 업그레이드된 다음 단계의 시작을 의미합니다. 링크: https://youtu.be/jV1vkHv4zq8?si=yFCNei72UmGnyHnC 타임라인: Gemini: Google의 가장 유능한 최신 AI모델 쌍둥이자리: 구글의 가장 최신의 유능한 AI 모델 00:00:00 구글 AI를 관리하는 CEO 산다르 피차이와 AI 전문가 데미스 하사비스가 AI의 중요성에 대해 이야기한다. 00:00:44 구글, 범용 AI '젬니' 출시! 00:02:01 ️구글의 Gemini 프로젝트로 인해 가능성이 거의 무한해짐. 00:03:35  여러 AI 프로젝트 중에서 Google의 Gemini이 첨단 기술 앞장서있다고 인정받고있다. 요약 -  Gemini: Google의 가장 유능한 최신 AI 모델 구글 CEO와 AI 전문가가 AI의 중요성에 대해 이야기 구글의 CEO 산다르 피차이는 AI를 관리하는 목적이 당사의 목표인 세상의 정보를 조직화하고 보편적으로 액세스할 수 있게 만드는 것이기 때문에 시작했다고 말합니다. 그러나 정보가 커지고 복잡해지면서, 이어지는 문제의 규모도 커졌습니다. 그래서 획기적인 기술 발전이 절실히 필요하다고 생각하였고 AI에 대해 연구를 진행했습니다. AI 전문가인 데미스 하사비스는 AI가 사람들에게 가장 혜택이 되며 가장 상호 연관성 있는 기술이 될 것이라며 AI연구를 진행하는 이유를 말합니다. 그리고 인간은 다섯 가지 감각과 파생되는 정보를 통해 세상을 이해한다는 것을 강조합니다. 구글이 출시한 AI 모델의 차이점은? 구글에서 범용 AI '젬니'를 출시했어요! Gemini는 모든 종류의 데이터를 가능한 많이 받아들이도록 만들었답니다. 기존에 존재했던 text-only, vision-only, audio-only의 모델과 달리, Gemini는 처음부터 multimodal이래요. 미래에는 음성, 이미지, 비디오, 코드, 텍스트 등 대부분 입력형식을 ...

[YouTube 요약] Gemini 실습: 멀티모달 AI와 상호작용

이미지
Gemini는 텍스트, 이미지, 오디오, 동영상, 코드에서 추론이 가능한 네이티브 멀티모달 AI입니다. 이 동영상에서는 Gemini와의 흥미로운 상호작용을 간략히 보여줍니다. 링크: https://youtu.be/UIZAiXYceBI?si=zJH_mk6T6nw2hjFe 타임라인 - Gemini 실습: 멀티모달 AI와 상호 작용하기 00:00:02 Gemini AI 모델을 테스트, 상호작용의 예시들 확인 00:01:15 고무 오리가 바다에서 뜰까, 오리의 이름이 무엇인지, 바다 한가운데 있는 오리의 서식은 어렵다. 00:02:03 게임 참가자가 단서를 보고 대상을 맞추는 게임. 00:04:08 오리는 친구를 만나러 가는 게 현명한 선택.  중요하지 않은 정보를 담은 예시들. 00:05:23 ️매트릭스 영화 총알피하기 장면 & 고양이 운동 신경과 쌍둥이자리 별자리 그림 설명. 요약 - Gemini 실습: 멀티모달 AI와 상호 작용하기 Gemini AI 모델 테스트, 상호작용 확인 Gemini AI 모델을 테스트하고 이를 영상으로 촬영하여 성능을 확인하였습니다. Gemini는 일련의 이미지를 보여준 후 이미지 내 무엇을 보이는지 추론합니다. 상호작용의 예시 중 "파란색 오리"를 인식하고 추론하는 과정이 담겨있습니다. 마지막으로는 손에 "파란색 오리"가 나타나며 가능성이 드물지만 이러한 결과도 나올 수 있다는 것을 확인하였습니다. 고무오리는 바다에서 떠 있을까? 밀도가 낮은 고무 오리는 물에 뜰 것으로 예상돼요. 고무나 플라스틱으로 만들어진 오리일 가능성이 높아요. 중국어에서는 '야즈'라고 하며, 1성으로 발음한다는데 다른 언어의 '오리'도 알아봤어요. 그리고 바다 한가운데 있는 오리가 육지 근처에 없으면 쉬거나 먹이를 찾기 어려울거에요. 이모티콘을 활용한 놀이/게임은? 이모티콘을 사용한 국가 맞히기 게임이에요. 게임 참가자는 단서를 보면서 대상을 맞춰서 참여도를 유도하며, 새로운 아이디어를 만...

[IT] AI 지형도_텍스트 생성 및 챗봇

이미지
  데이브레이크인사이츠, 대표 업체 120곳 소개 AI 지형도(사진, 데이 브레이크) '챗GPT'와 같은 텍스트 생성 인공지능(AI) 분야에 최소 700개 이상의 기업이 경쟁을 벌이고 있는 것으로 집계됐다. 벤처비트는 18일(현지시간) 기술 연구 전문 데이브레이크인사이츠가 텍스트 생성 AI 업계를 10개 분야로 나누고 대표적인 업체 120여곳을 포진시킨 업계 지형도를 소개했다. 데이 브레이크는 텍스트 생성 AI 업계를 분야에 따라 ▲텍스트 요약 ▲감정 분석 ▲텍스트 번역(이상 텍스트 분석) ▲가상 비서 ▲챗봇 구축 플랫폼 ▲챗봇 프레임워크 및 NLP 엔진(이상 대화형 AI) ▲글쓰기 도구 ▲코드 생성 ▲검색 ▲언어 모델 등 10개 카테고리로 분류하고, 해당 업체를 명시했다. 아래와 같은 카테고리별 설명도 곁들였다. 데이브레이크인사이츠는 이처럼 챗GPT와 유사한 기능을 가진 제품은 광범위하게 펼쳐져 있으며 매일 추가되는 추세라고 전했다. ■ 텍스트 요약(Text summarization) AI를 이용해 긴 텍스트에서 중요한 정보를 식별하고 짧은 문장으로 요약하는 기능이다. 비슷한 기능으로는 키워드 추출, 텍스트 분류 및 개체명 인식이 있다. 대표 기업으로는 퀼봇(QuillBot), 업워드(Upword), 스페이시(spaCy) 등을 꼽았다. ■ 감정 분석(Sentiment analysis) 텍스트의 감정을 긍정적, 부정적으로 판단하는 것은 물론 텍스트 이면의 어조와 감정, 의도를 읽어낸다. 감정 분석은 소비자의 피드백과 브랜드에 대한 태도를 분석하는 데 사용한다. 몽키런(MonkeyLearn), 레퓨스테이트(Repustate), 코히어(Cohere) 등이 이 분야의 회사다. ■ 텍스트 번역(Text translation) 딥엘(DeepL), 모던MT(ModernMT), 텍스트유나이티드(TextUnited), 프레이즈AI(PhraseAI) 등 AI 전문 번역 업체가 해당된다. 텍스트뿐만 아니라 음성 및 비디오 서비스도 제공한다. ■ 가상 비서(Virt...