징동(京东)은 알리바바에 이은 중국 내 초대형 전자상거래 플랫폼을 운영하는 기업입니다. 플랫폼에는 매일 수많은 상품이 등록되고 있죠. 상품에 대한 자세한 설명과 홍보는 각 공급자의 몫이지만 상품의 특징을 요약하고 소개하는 문구를 작성해 활발한 소비 행위를 이끌어내는 것은 징동의 일입니다.

이를 위해 징동은 자연어처리와 지식그래프 기술을 바탕으로 상품 정보를 요약해 소개 내용을 작성하는 AI를 개발하고 있습니다. 또한, 실제로 자사 전자상거래 플랫폼에 응용하고 있는 상황입니다. AI가 작성하는 수십만 개의 상품 소개 자료(글, 그림 포함)를 통해 징동은 새롭게 업데이트되는 상품 정보를 신속히 반영할 수 있습니다. 기존에 사람이 상품 소개 내용을 작성했던 것보다 훨씬 효율적인 작업이 가능한 것입니다.

상품 소개 요약은 기타 문서 요약보다 훨씬 어려운 작업입니다. 먼저, 상품의 디자인을 파악하고 그 특징을 잘 설명할 수 있어야 합니다. 상품의 외관적 요소가 소비자에게 큰 인상을 남기기 때문입니다. 또한, 상품마다 지닌 서로 다른 장점을 잘 부각시켜야 합니다. 소형 냉장고의 경우 공간 절약, 친환경 냉장고의 경우 에너지 절약 등 매 상품마다 셀링 포인트(selling point)가 있어 이를 공략해야 하는 것이죠.

오늘은 징동이 연구개발한 “전자상거래 상품 소개 요약 모델” 관련 논문을 간단히 설명한 기사 내용을 정리해보았습니다. 징동의 모델은 효과적으로 상품의 시각적, 텍스트적 요소를 종합하여 셀링 포인트를 파악하고 이를 바탕으로 간단명료한 상품 소개 내용을 작성할 수 있다고 합니다.

해당 논문의 제목은 <Aspect-Aware Multimodal Summarization for Chinese E-Commerce Products>이며 AAAI(American Association for the Artificial Intelligence) 2020에 게재되었습니다.

복합적(Multimodal) 요약 모델

상품 광고에 글자 수가 많다면, 소비자는 짧은 시간 내에 핵심 포인트를 찾기 어려워 많은 시간을 소비할 것입니다. 이는 소비자를 지치게 하고 결국 구매 실패를 초래하게 됩니다. 따라서 상품 정보를 잘 요약 및 소개하여 소비자에게 편리함을 제공하고 구매까지 이어지도록 해야 합니다. 징동이 개발한 모델의 목표는 소비자의 입장을 고려하여 상품의 시각적 요소 및 셀링 포인트를 담아내 요약하는 것입니다.

징동은 상품의 정보를 다방면에서 고려해 요약하는 방법을 제안했습니다. 위 그림(Figure1)과 같이 징동의 모델은 상품의 이미지, 제목, 기타 설명을 입력(input)하면 상품 정보를 요약합니다. 상품 제목과 기타 설명은 비교적 내용이 많은데 핵심어 검출 등의 기법을 사용하여 최대한 분량은 줄이면서 상품 장점은 포함된 소개 문장을 출력(output)하는 것입니다.

또한, 징동은 중국어 상품 소개 요약 데이터베이스를 구축하여 약 140만 개의 “상품-요약 소개” 집합을 저장했습니다. 상품에는 가전 기기, 의류, 여행용 캐리어 등 다양한 종류가 있습니다.

모델 소개

아래 그림(Figure2)과 같이 징동의 상품 소개 요약 모델은 포인트 생성 네트워크(Pointer-Generator Network) 기반입니다. 포인트 생성 네트워크는 구글 리서치(Google Research) 팀이 발표한 연구 결과로, 텍스트로부터 주요 핵심 내용을 1~2문장 길이로 요약하는 문서 요약 기법입니다.

기본적으로 문서 요약 성능은 RNN(Recurrent neural network) 및 CNN(Convolutional neural network) 등의 딥러닝 기법을 통해 향상되고 있습니다. 또한, 접근 방법이 두 가지가 있는데 하나는 추출식 접근법(extractive approach)으로 본문에서 의미 있는 부분을 선택하고 추출하여 이를 재정렬하는 것입니다. 다른 하나는 추상적 접근법(abstractive approach)으로 RNN과 같은 자연어 생성 기술을 활용하여 기존 텍스트 문장을 참고하여 창의적인 새로운 문장을 생성하는 것입니다.

포인트 생성 네트워크는 추상적 접근법을 우선적으로 사용하되, 필요시에는 추출식 접근법을 사용하는 하이브리드 형태로 핵심 정보만 담아낸, 깔끔한 요약을 출력할 수 있는 것입니다.

징동이 발표한 모델(MMPG, Multimodal Pointer-Generator Network)은 여기에 상품의 이미지를 추가한 것입니다. 인코더(encoder)로 상품 전체의 이미지를 넣으면 여러 부분으로 분할(segmentation)하여 각 부분의 특징을 디코더(decoder)로 분석합니다.

징동의 모델은 상품 요소 분석부터 시작하여 요약에 대한 중요성, 중복성, 가독성 등을 체크합니다. 상품 요소란 매 상품마다 지닌 각기 다른 속성을 의미하는데 위 그림(Figure2)에 있는 세탁기의 경우, (b)에 표시된 것처럼 용량(capacity), 에너지(motor), 조작법(control) 등이 요소가 됩니다.

(1) 중요성: 상품 요소에 기반을 둔 RAML(reward augmented maximum likelihood) 훈련을 통해 모델이 출력한 요약에 상품의 특징이 잘 드러나도록 합니다. RAML은 간단히 말해, 정답(ground-truth)과 예측 값의 차이를 최소화하기 위한 알고리즘입니다. 예를 들어, 세탁기의 실제 요소인 용량, 에너지, 조작법 등이 정답이 되고 RAML은 학습을 통해 입력 값이 주어졌을 때 정답을 출력하는 최대 가능성을 찾아내는 것입니다. 기존 기법인 ML(maximum likelihood)보다 간단하고 효율적인 계산이 가능하다고 합니다.

(2) 중복성: 상품 요소 커버 정도(cover degree) 메커니즘을 통해 중복된 정보를 제거합니다. 기존의 커버 정도 메커니즘은 동일 단어 중복만을 제거할 수 있었고 관련 단어 중복 문제는 처리하지 못했습니다. 위 그림 (c)에서 보이듯이 “noise”, “quiet”, “tranquil” 은 모두 세탁기 “동작 소리”를 묘사하는 단어들이지만 기존 메커니즘은 세 단어 모두 요약 문장에 포함시켰습니다. 하지만 징동 모델은 단어 간 유사도를 파악한 후 “reduce noise”로 간결하게 요약했습니다.

(3) 가독성: 상품 요소의 양상 리바운딩(aspect rebounding) 메커니즘을 통해 요약의 가독성을 향상시킵니다. 위 그림 (d)에 보이듯이 상품 요소의 리바운드(rebound) 서술은 요약의 일관성과 가독성을 방해합니다. 리바운드 서술이란, 요약 도입부에 세탁기 용량을 언급했는데 후반부에도 용량 관련 내용을 반복하는 것을 말합니다. 징동 모델은 디코딩 과정에서 “volume”, “storage” 등 비슷한 양상의 상품 요소가 반복 서술되지 않도록 관리하고 있습니다.

실험 결과

아래 표에서 보이듯, 기본적으로 MMPG 모델 시리즈가 높은 점수를 획득했음을 알 수 있습니다. 그중에서도 상품의 시각적, 텍스트적 요소(Aspect) 및 유사성 비교를 통한 일관성(Consistency)을 추가한 MMPG 모델이 가장 큰 효과를 거두었습니다.

전자상거래 플랫폼이 활발한 요즘 매일 출시되는 대량의 상품에 대한 소개 내용을 수공으로 작업하기에는 분명 한계가 있습니다. AI가 자동으로 상품 내용을 요약하여 설명한다면 작업 시간도 절약하고 효과적인 소비 촉진도 가능할 것입니다.

인쇄하기

이전
다음
1+

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.