네이버의 호텔 검색 개선

네이버가 LLM을 적극 도입해서 네이버 검색창을 통한 호텔 검색서비스를 개선했다는 내용을 네이버 기술 블로그 d2에 공개하였습니다. 꽤 많은 부분에서 여행서비스를 개발하고 있는 여행업에 자극이 되는 내용입니다.

네이버의 호텔 검색 개선

네이버가 호텔 검색 품질과 사용성 개선을 위해 검색엔진을 손보고 LLM을 도입한 내용을 기술 블로그에 공유했습니다.

네이버는 기존의 호텔 검색에 대해서 몇가지 문제를 정의했는데 아래와 같습니다.

  • 복잡한 검색 의도 처리 어려움
  • 다국어 검색 한계
  • 콘텐츠 및 시각적 정보 부족 등

이를 개선 하기 위해 LLM을 이용했다고 밝혔으며, 사용자 질의를 정밀하게 분석하고, 다국어 음차 변환 및 번역 모델을 도입했으며, 블로그 데이터를 활용해 POI 정보를 매핑하고 키워드 및 스니펫을 자동 추출하고 이미지 검색을 강화했다고 블로그에 밝히고 있습니다.

NAVER D2

네이버 기술 블로그인 D2에 게시 된 호텔 검색, 어떻게 달라졌을까요? 1편 - 문제와 해결

상세한 내용은 LLM을 어떻게 적용하고 개선에 활용하였는지 자세히 설명하고 있지만 굉장히 기술적인 내용들로 일반적으로 이해하기는 쉽지 않습니다.

아래 2~4편은 상세 기술 관련 내용이니 해당 기술에 관심 있으신 분들에겐 도움이 약간 되겠지만.. 일반적으론 .... 이런 걸 알아야 되는데.. 눈물 좀 닦구요..

NAVER D2

호텔 검색, 어떻게 달라졌을까요? 2편 - 지식 증류

NAVER D2

호텔 검색, 어떻게 달라졌을까요? 3편 - 검색 시스템

NAVER D2

호텔 검색, 어떻게 달라졌을까요? 4편 - 이미지 검색

복잡한 검색 의도

과거 네이버의 검색 엔진은 단어 기반의 짧은 질의에는 효과적이었으나, 복합적인 검색 의도를 가진 질의 처리에는 한계가 많았다고 합니다. 예를 들어, '도쿄 수영장이 있는 깨끗한 호텔'과 같은 구체적인 요구 사항을 포함하는 질의에 대한 검색은 불가능 하다는 것이죠. 당연히 과거의 키워드 매칭 방식으로는 검색의 확장이 쉽지 않았을 것입니다.

네이버는 LLM을 도입하여 사용자 검색 질의를 보다 정밀하게 분석하는 체계를 구축했다고 합니다. 사용자의 숨겨진 의도를 파악하고 복합적인 검색 조건을 이해하는 데 효과가 있었다고 합니다.

  • 블로그 데이터 활용을 통한 검색 의도 파악

네이버의 최대 강점이라고 봐야 겠죠. OTA는 할 수 없는 부분이 될텐데요. 네이버가 가지고 있는 호텔 관련 블로그 게시 글을 분석하여 사용자들이 실제로 검색에 활용하는 다양한 키워드('수영장', '깨끗한', '야경' 등)를 확보하고, 이를 POI(Point of Interest) 정보와 연계했다고 합니다. 사실상 이게 가장 효과가 큰 부분이겠죠. 거기다가 아무도 따라 할 수 없는 것이니..

이렇게 자신이 가지고 있는 가장 큰 장점, 사용자의 블로그 후기들을 활용해서 다양하고 복잡한 질의를 더 정확하게 이해하고, 그에 맞는 풍부한(?) 검색 결과를 제공할 수 있게 되었다고 합니다.

다국어 검색 문제, 오타 교정 기능

이건 뭐 다양한 문제를 가지고 있죠. 일반적으로 OTA나 여행사에서는 유의어 사전을 가지고 대응이 가능했기에 특별한 이슈가 없을 겁니다. 하지만 더 많은 사람이 특별한 의도 없이 검색하는 일반 검색 포탈이기에 이런 내용에 대한 대응에 기술을 동원하는 것도 이해가 됩니다.

아마도 좋은 결과가 만들어 졌겠죠.

일반적인 여행 관련 기업이라면 '북경'='Beijing', '베이징', '배이징', '뻬이찡' .... 으로 처리를 했을 겁니다. 이러한 데이터를 무한하게 생성할 수 없으니 LLM을 도입해 차후에 늘어나는 유사어에 대해서 대응하는 방법을 쓰는데 이건 여행업에서도 고민해 봐야 할 것 같네요.

콘텐츠 및 시각적 정보 보강

여기서 꽤 재미난 이야기를 해줍니다. 블로그 데이터를 활용해 키워드와 스니펫을 추출하고 이미지 검색에 접목했다고 합니다. 아마도 검색 목록에서 이미지의 노출이 늘어나는 효과를 만들어 낼 계획으로 보이는데 서비스에 어떻게 반영될지 궁금합니다.

샘플로 제공된 이미지, 야경을 찾는 사람에게 야경 이미지를 노출하는 형태

튼튼한 시스템, 검색 품질

뭐 이건 당연히 대형 인프라를 운영해야 하는 네이버이기에 해야 하는 이야기로 보이는데 POI에 대해서 아직도 체계적으로 관리가 되지 않았다는 반증이기도 해서 흥미롭습니다. 저는 네이버라면 이런건 매우 잘하고 있을 거라고 생각했거든요.

그래서 결론은?

네이버는 이번 호텔 검색에 LLM의 도입으로 좋은 결과를 얻었다고 자랑을 하고 있습니다.

전년 동월 대비 월등한 성과를 보였다는군요.

  1. 클릭 수: 전년 대비 70% 상승
  2. 호텔 예약 건수: 비수기임에도 불구하고 19% 증가
  3. 사용자 수 증가: 모바일 기준 16% 증가
  4. 검색 커버리지: UQC(Unique Query Count) 450% 상승, QC(Query Count) 157% 상승
  5. 다국어 검색 성능 개선: 다국어 대응 전후 UQC 13% 상승, QC 3% 상승
  6. 시각적 정보 강화: 이미지 검색으로 사용자 경험이 한층 풍부해졌습니다.

아쉬운 점은?

네이버의 호텔 서비스는 아직 호텔스컴바인에 의해서 서비스되고 콘텐츠가 제공되고 있습니다. 네이버 검색창을 통해 호텔스컴바인의 상세로 연결되는 부분이 아니고 각 검색을 통한 목록을 통해 이동하는 경우와의 데이터 비교가 있으면 좋겠네요.

소비자들이 네이버의 녹색창으로 검색하는 비율과 네이버 여행의 검색을 통해 검색하는 비율의 차이와 각 검색의 예약으로 이어지는 비율의 차이가 어떻게 될까요?

네이버 여행의 호텔 검색, 호텔스컴바인을 통해 서비스되고 있다.

네이버는 LLM을 통해 많은 성과를 내었지만 실제로 어디에 투자를 해야할지에 대해서 잘 판단하고 있을지가 궁금하네요.