[AI] AI 개발 능력보다 중요한 AI 활용 능력: 삶을 윤택하게.
인공지능(AI: Artificial Intelligence)은 단순한 기술 이상의 존재가 되어가고 있으며, 이제 AI는 우리 삶의 숨 쉬는 공기와 같이 눈에 보이지 않지만 어디에나 존재하며 세상을 지배하고 있는 것 같다.
AI 개발 능력보다 중요한 AI 활용 능력: 삶을 윤택하게
IT 기사, 경제 방송, 서점 자판대를 보면 인공지능(AI) 관련 서적이 눈에 띄게 많아졌다. 직접 AI를 만들지는 못하지만, 이미 출판된 다양한 서적을 통해 AI에 대한 이해를 높이고 활용하는 것은 누구에게나 가치 있는 일이며, 삶의 질을 높일 것이다.
최근, OpenAI 샘 알트먼 CEO는 AI칩 제조에 9,000조원 펀딩을 준비하고 있다는 기사가 나왔다. 1경에 가까운 자본을 만들 수 있을지 모르지만, 소프트뱅크, 사우디 국부펀드 등 순회하고 한국에도 내 안을 했기에 앞으로 기대가 크다.
2024년 2월 15일, OpenAI는 영상 생성의 새로운 시대를 열었다. 'Video Generate SORA'의 등장은 기존 영상 생성 방식과는 확연히 다른 차원의 결과물을 선보이며, 혁신이라는 찬사를 받으며 업계를 뜨겁게 달구고 있다. GPT와 DALL-E에서 사용된 기술들을 기반으로, SORA는 다양성을 확보하고 사용자 지시에 충실한 영상 생성을 가능하게 하기 때문이다.
백문불여일견: OpenAI Sora
펀드가 성공하면 어느 회사에 투자를 해야 하나! 이걸 알면 좋겠구나...
Chat GPT출시 이후 꾸준하게 새로운 제품을 찾아가며 테스트 중이다. 그중, 무료 크레딧으로 사용할 수 있는 유용한 제품을 글로 남기고 추후 방향에 따라 이용할 수 있도록 포스팅을 해본다.
- 내용에 들어가기 앞서, '프롬프트 엔지니어링'을 알아야 한다.(삼성 SDS 기사 참고)
- 프롬프트 엔지니어링이란, AI 모델은 스스로 학습하지만, 명확한 지침 없이는 원하는 결과를 얻기 어려울 수 있기에 인공지능(AI)에게 원하는 결과를 얻도록 명령어를 만드는 기술자를 뜻한다. '좋은 질문은 좋은 답변을 얻을 수 있다.'
내가 원하는 답변을 찾기 위해서는 구체적으로 상황 제시를 하고, 명확한 단어, 질문의 맥락이나 배경 정보를 추가해주면 좀 더 좋은 결과물을 얻을 수 있다.
예시) 여행 계획
- X: 여행 계획을 세우고 싶어.
- O: 02월 3째주, 5일 동안 가족 여행(성인, 아이)으로 유럽을 계획하고 싶어. 예산은 00만원이고, 역사적인 명소를 둘러보고 싶어.
예시) 정보 검색
- X: 인공지능 기술의 발전 현황은 어때?
- O: 최근 1년 동안 인공지능 기술의 발전 현황 중에서 '교육' 분야에 적용된 사례를 알려줘.
울 가족: 기도문 쓰려고 고민 하지 마세요. 세상의 모든 것을 학습한 AI에게 질문하고 남들보다 감동을 주는 기도문을 편리하게 쓰세요.(알려줘도 안 해서 이렇게 글을 쓰는 것이며, 아래처럼 적용해 보았으니 사용해 보세요.)
세상에는 발 빠른 사람들이 참 많다. 우리는 상황에 맞는 질문을 하기 위해 선두 주자가 만들어 놓은 명령어를 찾아서 이용하면 도움이 된다. 또한 '이' 아이들은 기존 대화를 기억하기 때문에 새로운 질문을 하기 위해서는 New Chat을 눌러 새 창을 열어서 질문을 하고, 대화하듯이 문장을 이어 나아가면 좋다.
아래에서 발 빠른 사람이 '프롬프트' 명령어를 테스트하고 만들어 놓은 것이라서 필요에 맞게 찾아 쓰면 된다.
- Careerhackeralex: https://www.careerhackeralex.com/
- 오픈 프롬프트: https://www.prpt.ai/
- gptable: https://gptable.net/prime
1. 대화형 AI
1_1. ChatGPT: OpenAI에서 개발한 대규모 언어 모델(LLM, Large Language Model) 챗봇이다. 텍스트 생성, 번역, 질의 응답 등 다양한 작업을 수행할 수 있는 강력한 도구이다. 현재 무료와 유료로 나뉘어서 사용할 수 있지만 이전 모델 'ChatGPT3.5'을 일반인이 사용하기에는 충분하다.
'Web보다는 Mobile 어플'에서 사용하는 것을 추천한다. 모바일은 '음성' 서비스를 지원하기 때문에 좋다.
1_2. Copilot: 마이크로소프트에서 GPT-4와 빙 검색을 접목한 대화형 AI로 '뉴빙'이라고도 하며, 이미지도 첨부하여 질문을 할 수 있기에 여러모로 편리하다.
아래에서 설명 할 Dall.E를 이용하여 "사이트 內에서 이미지도 생성" 및 여행 일정등 여러가지 서비스를 겸하고 있다.
1_3. Gemini: Google Bard가 Gemini로 바뀐 모델이다. 질문에 답하고, 텍스트를 생성하며, 번역하고, 코드를 작성하는 챗봇 형태의 모델이다. 우선 아래 링크를 통해 어떻게 변했는지 살펴 보면 좋을 것이다.
- Gemini 실습: 멀티모달 AI와 상호작용
확장 프로그램을 이용하면 이메일, 문서, PDF등 요약을 해주며, 자사 프로그램들과 함께 정보를 제공한다고 설명한다. 현재 언어 설정을 영어로 변경해야 한다.
- 확장 기능 소개 \ Bard
- Gemini 메인 화면
Test 1) 딸 아이 수학 문제를 사진 찍어 풀어줘 했더니 맞추었다. ChatGPT는 못 맞춤. 다른 언어 모델에서는 이상한 말을 한다. 아직 부족한 부분이 있다는 걸 느낀다.
1_5. Cue: 네이버에서 선보이는 AI검색 서비스이다. 현재 베타 서비스 기간이라서 대기자 명단에 등록을 해야 한다. 기존에는 맛집을 찾기 위해 지도 서비스를 따로 접속을 한 반면에 Cue에서 맛집 및 제품을 찾아 달라고 하면 척척 해결해 준다.
2. 업무 생산성 AI
2_2. Namelix: 비지니스 네임 생성기이다. 네임릭스는 인공지능(AI)를 활용하여 브랜드 이름을 생성하는 웹 기반 플랫폼이다. 사용자는 사업 방향을 텍스트로 간단하게 입력하면, 적합한 브랜드 이름을 생성해 준다.(네이밍 및 로고 생성)
3. 이미지 생성 또는 비디오 AI
현재 서비스하는 업체가 많다. 그중에서 대표적인 것과 필자가 사용하는 것을 적는다.
아래 그림은 '미드저니'를 활용한 디지털 아트이다. 미술전에서 1등 상을 받아 예술가들 사이에서 논란이 생겼다. 기사를 보려면 클릭...
제이슨 앨런(Jason Allen)이 미드저니(Midjourney)를 이용해 만든 그림 '우주 오페라 극장'. 출처 : 미드저니 홈페이지 |
3_1. Midjourney: 많은 유저들이 사용을 하고 있으며, 놀라운 결과물을 만들 수 있다. '유료'라서 처음 제공하는 크레딧을 잘 활용해야 한다. 제작하기 위해서는 'Discord"로 접속을 하여 제작을 하게 된다.
3_2. DALL.E.3: DALL-E 3는 OpenAI에서 개발한 텍스트 기반 이미지 생성 AI 모델입니다. 사용자는 텍스트 설명을 입력하면, DALL-E 3는 해당 설명을 기반으로 사실적인 이미지를 생성한다. DALL-E 3는 텍스트 설명에 대한 이해력과 이미지 생성 능력이 뛰어나 다양한 분야에서 활용될 수 있다.
3_3. Blockade Labs: 자신의 생각하고 상상하는 내용을 텍스트로 입력하면 몰입형 360이미지를 만들어 주는 곳이다. 게임 개발자는 Skybox를 사용하여 게임 배경등을 손쉽게 만들 수 있을 것이다.
3_4. Fooocus: 스테이블 디퓨전 과 미디저니의 장점만 가진 고품질의 AI이미지 생성 도구이다. GitHub에서 다운 받아 내 PC에 설치하여 사용할 수 있는 방법과 Google Colab를 이용해서 사용하는 방법이 있다. AI가 생성한 이미지와 자기 자신의 사진을 믹스 하는 방법도 있다.
3_5. Stable Diffusion: 2022년에 출시되어 현재는 한국어를 지원한다. 텍스트 설명에 따라 고화질의 이미지를 생성하며, 인페인팅, 아웃페인팅, 이미지 생성에 적용할 수 있다.
프롬프트 명령어가 생각나지 않는다면, 다른이의 그림을 클릭하여 '프롬프트 복사'를 해서 만들면 된다.
3_6. runway: 렌웨이는 다양한 작업을 자동화하는 플랫폼이다. 사용자가 코드를 작성하지 않고도 AI모델을 사용하여 이미지 편집, 영상 제작, 웹디자인을 할 수 있다.
이미지를 움직이는 애니메이션으로 만들어 주며, 최근 업데이트 부분은 '블러쉬'를 활용하여 움직임을 주고 싶은 부분을 칠하면 효과가 나타난다.
3_7. Kaiber: 쇼츠, 틱톡 등 1분 이내의 짧은 영상을 시청하는 사람들이 많다. 이미지와 음악, 강단한 명령어를 입력하면 AI가 멋진 영상을 제작해주며, 다양한 결과물을 만들어 내는 재미를 느낄 수 있다.
아래 영상은, Fooocus + Kaiber를 이용하여 만든 결과물이다. 인물 및 배경이 재미나게 변화한다.
4. 음성 AI
4_1. ElevenLabs: 우리가 흔히 사용하는, OK Google, Siri는 TTL(Text To Speach)서비스이다. 과거의 TTS가 아니라, AI기능이 반영되어서 사람이 직접 읽는 것과 동일한 퀄리티의 TTS 서비스이다. '사용자의 목소리를 녹음하여 업로드하면 사용자의 목소리를 학습하여 자신만의 목소리를 만들 수 있다.' 또한 성우 같은 좋은 목소리도 기본 제공하고 있으니 더빙이 필요할 때 유용할 것 같다.
5. 음악 AI
5_1. Suno AI: 이전에는 'Discod'활용하여 만들었는데 현재는 웹 사이트를 통해 쉽게 음악을 만들 수 있다. 가장 사실적이고 자연스러운 음성을 제공하기 때문에 가사를 넣고, 스타일을 지정하여 멋진 노래가 만들어보자. 앗! 가사는 'Google Gemini'를 이용하자. 정말로 놀라울 따름이다. '특별한 날' 가족들을 위해 노래를 만들어서 주어도 좋을 것 같다.
글을 작성하면서 누님과 통화 후 만들어본 노래. 끝 부분이 딱! 끊어지는 이유는 무료.
5_2. AIVA: 작곡하는 인공지능. 프랑스 음악저작권협회가 인정한 세계 최초의 가상 작곡가이다. '클래식 및 교향악' 작곡 전문 회사라서 감미로운 음원을 만들 때 사용하면 좋다.
6. 유튜브 및 문서 요약 AI
6_1. lilysAI: 다양한 주제에 대한 유튜브 영상의 핵심 내용, 흥미로운 인사이트, 시청 팁을 제공하는 서비스이다. 시간을 절약하고 전체 영상을 시청하기 어려운 경우 빠르고 효율적으로 영상의 핵심을 파악할 수 있다. 또한 블로그에 글을 쓸 수 있도록 타임 별 이미지와 내용을 정리해주니 이보다 더 할 수 없는 것 같다. 하루에도 엄청난 정보속에서 언제 보고 듣고 정리할까 고민하는 사람들에게 추천한다.
7. 동영상 생성 AI
7_1. D-ID: 텍스트와 이미지(사진)를 기반으로 가상 인간, 동영상을 만들어내는 플랫폼이다.
텍스트 대본 및 음성을 입력하면 AI가 '인물 사진' 분석하고 자동으로 입술 움직임을 실시간으로 맞춰줍니다. 아직은 어색한 부분이 있지만, 학습을 통해 발전할 것으로 보고 있다.
- 간편한 사용: 텍스트를 입력하고 성우를 선택하면 끝! Vrew AI가 나머지를 알아서 처리합니다.
- 자동 영상 제작: Vrew AI는 글을 읽고 핵심 내용을 파악하여 '텍스트에 맞는 배경 이미지, 영상, 음악' 등을 자동으로 생성합니다.
- 편집 기능: 자르기, 합치기, 화면 전환, 텍스트 추가, 효과 적용 등 다양한 기능을 제공하여 원하는 영상을 만들 수 있습니다.
- 목소리 및 음악: 500여 종의 AI 목소리와 무료 음악을 제공하여 영상에 풍성함을 더합니다.
AI는 눈 깜짝할 사이에 발전하며 우리 삶에 엄청난 영향력을 행사하고 있으며, 주변 세계를 이해하고 소통하는 AI는 앞으로 더욱 강력한 힘을 발휘할 것입니다.
위에 소개한 사이트 외에도 수많은 사이트들이 존재하며, 우리는 이를 통해 자신의 삶을 더욱 편리하게 만들 수 있는 다양한 방법을 찾아야 한다.
물이 흐르지 않으면 썩는다는 말은 정체 된 물이 더러워지고 썩는다는 뜻이다. 흐르는 물처럼 끊임없이 생각하고 고민하며 발전해야만 썩지 않고 의미 있는 삶을 살 수 있다는 말이다.
앞으로 **"나에게 필요한 AI는 무엇인가?"**라는 질문을 던지고, 적극적으로 탐색하며 활용해야 할 것이다.
이상.
댓글
댓글 쓰기