SearchGPT, GPT-4o mini 및 Llama 3.1 업데이트 요약

최근 한주 동안에도 Generative AI 산업에서는 주요 업데이트 소식들이 들려왔습니다. SearchGPT, GPT-4o mini 및 Llama 3.1 업데이트 사항인데요. 중요한 기업의 업데이트들의 핵심적인 사항들만 요약해서 공유하려고 합니다.

  • SearchGPT: 웹의 실시간 검색 정보를 LLM 통해 원하는 정보를 쉽게 얻는 방식
  • GPT-4o mini : 가장 비용효율적인 작은 규모의 GPT 언어 모델
  • Llama 3.1 : 405B 모델로 기존 모델 중 가장 성능이 우수한 대형 모델

1. SearchGPT

SearchGPT

(1) SearchGPT

OpenAI에서 GPT-4o mini를 발표하고 몇일 지나지 않아 바로 또 색다른 GPT를 발표했습니다. SearchGPT는 검색 기반의 답변을 제공하는 AI 모델입니다. 이는 간단하게 생각해서 다음 2가지 장점이 있을 것입니다.

  • 할루시네이션을 최소화하기 위하여 명확하고 관련성 높은 출처를 제공 가능
  • 과거 학습한 데이터가 아닌 최신 정보에 기반한 답변 가능

현재까지의 ChatGPT 모델은 성능을 지속적으로 업데이트하고 있지만 한계로 지적되는 것이 위에 2가지였습니다. 완벽하게 제거할 수는 없겠지만 이를 통해 많은 오류를 제거할 수 있을 것으로 보입니다. 참고로 SearchGPT 기능을 Perplexity.AI에서 이미 제공하고 있는데 이 제품과 어떤 차이점이 있을지 확인해 봐야겠습니다.

Perplexity AI : ChatGPT, Claude, LLaMa를 한 곳에서 사용하는 방법!

참고로 아직 공식적으로 오픈하지는 않았고 프토토타입으로 일부 사용자들을 대상으로 테스트하고 있는 중이라고 합니다.


(2) SearchGPT 특징

2. SearchGPT 특징

SearchGPT의 특징은 위에 이미지 2장으로 간단하게 설명이 됩니다.

질문을 하면!!!

1) 답변과 함께 출처를 함께 제공한다.
2) 이제는 구글에 검색하고 하나씩 콘텐츠를 클릭해서 확인할 필요가 없다.
3) GPT가 우리 대신에 검색하고 웹페이지들을 확인해서 필요한 답변만 제공한다.
4) 답변 하단에는 우리에게 도움이 될만한 질문 혹은 추가 콘텐츠를 제공한다.

한마디로 우리의 검색 시간을 최소화시켜주고, GPT 자신이 어디서 정보를 가져왔는지 알려줍니다.

SearchGPT를 사용해보고자 한다면 현재는 Waitlist에 등록해야 하며 하단을 클릭해서 신청할 수 있습니다.

SearchGPT – Join Waitlist 바로가기

SearchGPT - Join Waitlist 바로가기

2. 비용 효율적인 GPT-4o mini

GPT-4o mini

비용 효율적이라고 표현했지만 실질적으로 저렴해진 GPT 버전이 탄생했습니다. GPT 3.5 Turbo 버전보다도 60%이상 저렴한데요. 소형 모델이기 때문에 비용이 저렴하고 그만큼 활용도가 높습니다. 파인튜닝, 임베딩 등 작업을 수행할 때 모델이 크면 그만큼 비용이 많이 드는데 최소화 모델로 자신만의 데이터를 활용하여 커스텀하고자 한다면 GPT-4o mini가 비용효율적일 것입니다.

Openai GPT-4o mini 업데이트 원문

아래에서 실제 비용을 정리해서 비교해보았습니다.

구분GPT-4o miniGPT-4o
가격Input
$0.150 / 1M tokens
Output
$0.600 / 1M tokens
Input
$5.00 / 1M tokens
Output
$15.00 / 1M tokens
토큰컨텐스트 윈도우
128k
컨텐스트 윈도우
128k
데이터학습23년 10월까지23년 10월까지

GPT API, 임베딩, 파인튜닝 등 가격 확인

GPT-4o mini의 가격을 보면 입력 토큰 100만 개당 15센트, 출력 토큰 100만 개당 60센트로 가격이 책정되어 이전 프론티어 모델보다 훨씬 저렴합니다. 그외 토큰이나 데이터학습 등은 기존 모델과 유사한 수준입니다. 또한 현재 GPT-4o mini는 API에서 글자와 비전을 지원하며, 텍스트, 이미지, 비디오 및 오디오 입력과 출력에 대한 지원은 향후 제공될 예정이라고 합니다.


3. GPT-4o mini 주요 향상된 기능

GPT-4o mini 지표

GPT-4o mini는 기본적으로 소형 모델이기 때문에 GPT-4o에 비해서는 성능이 부족하지만 다른 동일 선상의 소형 모델에 비해서는 우수한 평가지표를 보입니다.

특히 강점은 다음과 같습니다.

  • GPT-4o와 동일한 범위의 언어를 지원
  • 함수 호출 능력이 개선되어 개발자가 데이터를 다루고 외부 시스템과 연결 시 용이
  • 추론 작업, 수학 및 코딩능력, 다중 모든 추론 능력 등이 특히 우수

결국 이번 업데이트를 통해서 AI를 사용하는 비용이 점차 감소하고, 소형화 되면서 기업이 도입하기 용이해지며, 텍스트와 비전에서 오디오 및 비디오 영역으로 점차 범주가 확대되고 있는 기조를 확인할 수 있었습니다.

신규 GPT-4o 사용 방법 및 업데이트 정리(원문 다운)
ChatGPT on your desktop 다운로드 바로가기(mac만 가능)


4. Llama 3.1 405B

Llma 3.1 405B

Meta의 Llama의 행보는 조금 달랐습니다. 초기부터 오픈소스형 모델로 내놓았기 때문에 다른점도 있었지만 소형 모델에서 점차로 범위를 확장하여 이번에는 405B 버전을 시장에 공개했습니다.

Llama 3.1 405B 업데이트 원문 바로가기

Llama 모델은 다국어이며 GPT-4o와 동일한 128K의 컨텍스트 길이를 가지고 있습니다. 또한 다른 도구나 시스템과 연동하는 기능, 전반적으로 더 강력한 추론 기능을 갖추고 있습니다. 이를 통해 더 긴 장문의 텍스트를 요약하고, 다국어로 대화하거나 코딩 어시스턴트와 같은 역할을 훌륭히 수행해 냅니다. 또한 라이선스를 변경하여 개발자가 405B를 포함한 Llama 모델을 사용하여 다른 모델을 개선할 수 있습니다.

이 405B 모델은 15조 개 이상의 토큰으로 훈련되었으며 16,000개가 넘는 H100 GPU가 활용되었다고 합니다. 이를 위해 독특한 모델 아키텍처를 사용했다고 하는데 이 부분은 위에 업데이트 원문을 확인해주세요.

Llama 3.1 405B 모델 다운로드 받기
Llama3를 내 PC에서 무료로 사용하는 방법 (GPT4All & RAG)

Llama에 집중하는 이유는 오픈소스이기 때문입니다. 그만큼 AI 모델 사용하고 변형하는데 자유롭습니다. 그렇지만 일반 개발자가 405B를 사용하는 것은 상당한 컴퓨팅 리소스나 전문지식이 필요합니다. 그래서 아래와 같이 여러 탑급 파트너사들과 협력 체계를 갖추고 지원해준다고 합니다.

Llama Partners

5. 마무리

Openai는 소형화를 Meta의 Llama는 대형화 모델을 일주일 간격으로 발표했습니다. 이는 경쟁자의 영역으로 침투하고 확장하기 위한 전략일텐데 그만큼 AI를 활용하고자 하는 기업들에게는 여러 선택지가 제공될 것 같습니다.

테크뷰는 이처럼 여러 AI 제품들을 분야와 카테고리별로 구분하고 그 기능, 가격, 사용자 후기도 함께 공유드리고 있으니 참고해보세요!!

Reviewinsight, Generative AI

6. AI 챗봇 솔루션 비교, 분석 리포트

여러 AI 솔루션 중 가장 많이 사용되는 도구가 챗봇일 것 입니다. 테크뷰에서는 다양한 AI 챗봇 솔루션 중에 최적의 제품을 선택할 수 있도록 지원해드리고 있습니다. 이를 위해 ChatGPT, Claude와 같은 LLM부터 검색 기반의 Perplexity, 또는 회사 기업 정보를 학습 시킨 커스텀 챗봇까지 다양한 AI 챗봇 비교 리포트를 송부드립니다. 비교/추천 리포트가 필요하신 기업 담당자 분들은 위에 이미지를 클릭하여 설문을 작성해주시면 됩니다.

본 서비스에는 아래와 같은 사항이 포함되어 있습니다.

  • 기업과 팀의 니즈에 맞춘 AI 챗봇 추천
  • 필요한 기능 보유 여부를 확인한 비교표 정리
  • 도입 시 전담 컨설턴트와 본사 기술 지원

함께보기 좋은글
0. Sora AI 사용 방법 및 사용 후기(영상 제작)
1. 업무 시간을 줄여줄 AI 툴 도구 모음
2. Llama3를 내 PC에서 무료로 사용하는 방법 (GPT4All & RAG)
3. ChatGPT vs Gemini vs Claude 비교 총정리(&대안)
4. Perplexity AI : ChatGPT, Claude, LLaMa를 한 곳에서 사용하는 방법!
5. 신규 GPT-4o 사용 방법 및 업데이트 정리(원문 다운)
6. 네이버 클로바 스튜디오 사용 방법 및 후기
7. Meta AI Llama 3 출시와 무료 사용 방법!
8. Sora : OpenAI 신규 모델, 텍스트로 비디오 영상 제작
9. 구글 제미나이 1.5 사전 등록 방법 및 Gemini API 사용
10. AI시대 경제적 해자(Moat)에 대해서

reviewinsight100

리뷰인사이트는 SaaS 플랫폼 ‘테크뷰’를 통해 B2B 소프트웨어 선택을 더 쉽게 만듭니다. “테크뷰를 만나면 선택이 쉬워진다”는 믿음으로, 신뢰할 수 있는 콘텐츠와 리뷰를 전달합니다. SaaS 산업과 함께 성장하고 싶은 여러분을 환영하며, 유익한 정보로 꾸준히 찾아뵙겠습니다.
지금 구독하고 최신 SaaS 인사이트를 가장 먼저 받아보세요!

댓글 남기기

댓글 남기기

테크뷰 블로그에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기