Web Analytics
View My Stats

[심층분석] 네이버의 서치 GPT에 대한 이해와 차별점

2023. 4. 4. 17:16IT정보

반응형

네이버가 지난 실적발표에서 상반기 안에 '서치 GPT'를 선보이겠다고 발표함에 따라 관심이 쏠리고 있는데 마이크로소프트(MS)가 자사 검색 서비스 빙(Bing)에 챗GPT 기술을 적용하는 것처럼 네이버 검색에도 서치 GPT가 적용되면 검색의 패러다임이 바뀔 것이라는 기대 때문입니다. 

오로라 프로젝트

언뜻 오픈AI의 챗GPT 열풍에 편승하는 것으로 보이나, 네이버는 지난해 9월부터 '오로라 프로젝트'를 통해 AI로 검색 환경을 개선해 왔습니다. 
향후 국내 최대 한글 데이터베이스를 보유하고 있는 '하이퍼클로바'를 검색 서비스에 적용한다면 챗GPT 등 다른 생성 AI와의 차이점과 경쟁력도 주목됩니다.
오로라(Aurora) 프로젝트는 'AI 기반 강력한 범용 관련도 순위 매기기 및 응답'의 약자인데 AI 기술로 검색 기술을 고도화한다는 의미입니다. 
최근 몇 년새 포털 사용자들은 특정 키워드를 넘어 문장처럼 복잡한 형태의 검색어를 입력해 최적의 결과를 얻으려 하는데 이를 충족시킨 게 바로 챗GPT입니다. 
네이버도 이처럼 변화한 사용자 패턴에 맞춰 적합한 정보를 찾아주는 알고리즘을 적용했다.
오로라 프로젝트는 △뉴럴 매칭 △지식스니펫 △동일 출처 검색결과 묶음 등 기술을 적용하는데 뉴럴 매칭은 검색어와 디지털 문서의 서로 다른 표현을 연결하는 기술입니다. 
기존에는 검색어와 동일한 단어가 포함된 결과만 확인할 수 있었다면, 뉴럴 매칭을 통해 유의어나 동의어 검색 결과도 함께 확인할 수 있습니다.
이렇게 얻은 다양한 정보를 한눈에 보기 쉽게 정리하는 것이 지식스니펫으로 사용자가 검색 결과에서 원하는 정보를 쉽게 확인하도록 리스트형·테이블형·카드형·답변 강조형 등 가독성 높은 형태로 제공합니다. 
하나의 웹 문서가 아닌 여러 웹문서로부터 추출된 다양한 결과를 함께 보여주기도 하며 일반백과와 어린이백과 등 서로 다른 출처에서 사용자의 연령에 맞는 결과를 뽑아주기도 하는데 추가로 얻을 수 있는 정보까지 제공하는 게 '동일출처 검색결과 묶음' 기술입니다.

서치 GPT는?

서치 GPT는 네이버의 초거대 AI 하이퍼크로버를 기반으로 검색 결과를 고도화한 서비스로 오픈 AI가 챗GPT라는 베타 서비스를 내놓은 것처럼, 네이버도 서치 GPT라는 베타 서비스로 생성 AI 기술을 실험하는 것입니다. 
오로라 프로젝트가 신뢰도 높은 웹 문서만을 검색 대상으로 한다면 서치GPT는 블로그나 클로나 노트 정보 등 UGC(사용자생성콘텐츠)까지 학습해 결과를 도출합니다. 
네이버는 서치 GPT 베타 서비스 결과에 따라 순차적으로 검색 서비스에 적용할 계획으로 오로라 프로젝트와 서치 GPT가 합쳐지면 네이버 검색은 챗GPT 기능을 적용할 마이크로소프트(MS)의 검색 엔진 '빙(Bing)'과 경쟁할 전망입니다.
구글과 바이두 역시 AI 챗봇 기술을 검색엔진과 통합하는데 오로라 프로젝트의 뉴럴 매칭처럼 검색어의 의도를 해석하고, 지식스니펫처럼 관련성 높은 정보를 텍스트·이미지·동영상·통계·링크 등으로 제공하는 것입니다. 
구글은 이미 검색창에 이같은 AI 기술을 일부 적용했고, 챗GPT 같은 챗봇에 네이버 지식스니펫처럼 출처를 명기할 수 있는 서비스 '스패로우'를 수주 내 공개할 계획입니다.

검색문화의 변화

전문가들은 결국 검색 포털의 인터페이스가 챗봇과 같은 대화 형태로 변화할 것으로 보고 있습니다. 실시간 정보까지 반영하는 네이버의 지식스니펫, 대화 형태에 출처를 명기하는 구글 스패로우, 하나의 완결성 있는 답변을 생성하는 챗GPT의 장점을 취하게 될 것이라는 전망입니다. 
빙이나 구글 검색에서 생성 AI가 적용되면 챗GPT처럼 핑퐁치듯 포털과 사용자가 질문과 답변을 이어가는 형태로 포털 인터페이스가 변화할 것으로 예상하고 있습니다.
그러나 최근 대화형AI에서 실제로 많은 생성 AI들이 그럴싸한 거짓을 수없이 만드는 것을 볼 수 있는데 이러한 신뢰성 부재 문제는 해결해야 할 문제이기도 합니다.

서치 GPT의 차별점

서치 GPT는 하이퍼크로버를 네이버 검색에 특화시킨 검색 대규모 언어모델(Search LLM) ‘오션(OCEAN)’을 백본(back-bone)으로 활용하는데 이를 바탕으로 네이버가 20년간 축적한 사용자 검색 흐름 데이터를 모델링해 사용자가 검색 목적을 달성할 수 있게 최적의 경로를 안내, 이를 통해 검색의도와 결과를 더 잘 이해하고 신뢰성이 강조된 답변을 생성할 수 있게 하는 기술입니다.
서치 GPT는 사실입증(Fact verification) 모델 및 RLH2F를 통해 최신성과 사실성이 보장된 신뢰도 높은 검색결과를 생성한다고 네이버는 강조하고 있습니다.
또한, 서치GPT는 네이버 다양한 서비스를 활용할 예정인데 이미 네이버는 지난 20년간 콘텐츠 생산자와 소비자를 연결해 왔는데 물건 구매 목적의 질문이라면 쇼핑서비스를 연결해 주고, 놀러 갈 곳에 대해 묻는다면, 네이버플레이스 정보를 보여주는 식으로 서비스를 한다는 것입니다. 
음악‧웹툰 등 네이버 생태계 내 다양한 서비스와 연계해 질문자가 최종적으로 도달해야 하는 목표에 부합시킬 수 있게 하고 이뿐 아니라, 멀티모달 기술을 활용해 이미지를 통해서도 원하는 답변을 얻을 수 있도록 한다는것입니다.
서치 GPT가 정확하고 신뢰성이 높은 검색 결과와 함께 다음 액션(action)을 연결, 사용자 목표를 달성시켜 주는 훌륭한 한국형 GPT 서비스를 제공해 주기를 바라봅니다.

반응형
src="https://www.statcounter.com/counter/counter.js " 비동기>