AI 컨택센터, 소비자 관점에서의 옴니채널에 대한 고민

JayLee Contact Center, Omni Channel

본글은 상용화를 앞두고 있는  Inbound/Outbound 컨택센터 인프라와 인공지능 대화형 엔진 및 요소기술을 준비하는 과정에서 ‘사용자 경험(User eXperience)’에 대한 새로운 고민과 도전기술과제를 공유하기 위한 목적에서 몇 가지 고민을 포함하고 있다.

먼저, ‘옴니채널’이라는 용어를 위키피디아에서에서는, 최초 시도 사례로 2003년 BestBuy가 월마트의 전자제품 코너에서 온/오프라인 채널 모두를 통해 고객사후응대를 했던 기록을 사례로 꼽고 있다. 물론 BestBuy의 사례 이전, 미국 PC통신의 온/오프라인 가입자 채널 유치전략 등이 언급되기도 하지만 아무튼 요지는 “사용자의 경험 증대를 위해 특정 채널/영역에 제한을 두지 않는, 고객과의 다양한 채널을 통한 커뮤니케이션 전략”을 ‘옴니채널’이라고 정의하고 있는듯 하다. https://en.wikipedia.org/wiki/Omnichannel

많은 컨택센터 솔루션 기업들과 구축업체들이 이야기 하는 옴니채널이 완전히 개화되기 전에 인공지능 고객상담이라는 주제가 등장을 하면서 시장과 기술분야 모두에 상당한 변화가 등장했다.

시스코, 제네시스, 어바이어, 알카텔 루슨트와 같은 컨택센터 솔루션을 공급하는 회사들의 마케팅문서나 기술백서에 이 ‘옴니채널’이라는 키워드는 곳곳에 언급되고 있다.

2024년 500조에 도달하리라는 이 시장(https://www.strategyr.com/MarketResearch/ViewInfoGraphNew.asp?code=MCP-1145 ) 을 둘러싼 솔루션 공급업체, 컨택센터 아웃소싱 전문업체, 구축, 통신업체들의 각축에 2010년대 하반기 불어닥친 인공지능 기술 가운데 자연어 대화기술과 STT, TTS 기술의 성숙이 결합되면서 이제 가시적 결과물을 내어 놓겠다는 업체들이 출현을 하고 있다.

그런데 문제는 이 ‘옴니채널’은 소비자의 관점이 아닌, 공급자 즉 기업사용자의 관점에서만 접근되고, 준비되고 있다는 점이 실제 구현과정에서 확인이 되었고, 이를 해결 하기 위한 여러 노력을 기울여 왔다.

즉 사용자가 온라인이나 오프라인에서, 혹은 온라인에 있어서 웹, 모바일 어플리케이션, 각종 SNS는 물론이고 가장 전통적인 전화 등의 접촉 채널을 하나의 단일한 시스템에서 이를 수용할 수 있다는 ‘옴니채널’ 수용의 주체는 ‘기업사용자’의 관점일 뿐이지, 실제 뭔가 불편한 점이나 문의, 클레임을 시작하는 최종 소비자에게는 해당 시점에서 ‘옴니채널’은 아니라는 점이다.

최종 소비자들에게는 여전히 대면/비대면 혹은 온라인, 오프라인 단일 채널일 뿐이고, 기업공급자와의 커뮤니케이션 과정에서, 기본 제약(고도 근시와 같은 장애인에게 웹/앱을 통한 접근, 원활한 대화가 불가능한 사용자에게 콜센터를 통한 접근 등)은 물론, 상황의 변화에 따른 제약(만원의 지하철/버스에서의 커뮤니케이션, 소음이 많은 환경, 회의중 등)이나 민감정보를 포함한 확인절차(생년월일, 주소 등을 통한 본인확인 등) 등에서 여전히 단일채널일 뿐이다.

실제 인바운드 혹은 아웃바운드 컨택센터를 STT/TTS를 통해 자연어처리 엔진과 결합시켜 서비스를 구현하는 과정에서는 자연어처리 엔진의 한계, 구현상의 한계로 인해 실제 사람에 의해 서비스를 제공하는 숙력된 상담사의 수준에 도달하려면 상당한 시간이 더 요구되리라는 점을 확인할 수 있었다.

발화 과정에서 “못들었어요. 뭐라고요? 아까 뭐라고 했지요?” 와 같은 재질의는 말할 것도 없고, “예, 응, 맞아” 혹은 “아니, 노, Nop”과 같은 짧은 답변에 대한 인식율이 상대적으로 떨어진다는 점, 답변 과정에 사용자의 발화간섭, 안내 내용 가운데 “얼마라고요? 몇 번이라고 했죠?” 와 같은 숫자와 관련된 항목을 포함한 부분재질의에 대한 답변처리 등을 원만하게 처리하지 못하게 되면 사용자 겪는 불편함, 답답함은 서비스에 대한 전반적 불만족지수를 높이게 된다.

컨택센터 솔루션 업체들과 아웃소싱 업체들은 결국 상담사와의 자연스러운 연결을 통해 해당 문제를 해결할 수 있다는 답변을 내놓고 있지만 업무 시간 이외, 상담사가 응대하기 어려운 시간에 발생하는 문제는 여전히 남는다. 또한 자연어 기반의 챗봇의 제약과 한계를 이런식의 ‘회피’와 ‘우회’가 지속될 경우, 전문상담사로의 handover 지점의 intent와 다이얼로그에 대한 추적/분석과 강화학습을 통한 지속적인 인식능력 제고의 문제는 여전히 과제로 남게될 뿐이다.

Steve Jobs는 2007년 아이폰을 소개하면서, 최고의 직관성과 정확성을 자랑하는 사람의 손가락을 이용한 터치가 당시 스마트폰의 표준으로 보여졌던 블랙베리의 물리키보드에게 냉소를 보내던 유명한 장면이 있다.

당시의 아이폰이 강조한 터치인터페이스는 최초의 시도는 아니었더라도 터치를 통한 대화형 인터페이스가 물리키보드로 특징지어진 종래의 방식보다 뛰어남을 강조함이었다.

하지만 이제 사람과 기기의 양방향 커뮤니케이션은 인간이 지닌 시각/청각/촉각에 더해 자연어에 대한 인지능력, 접촉고객의 정황정보 그리고 종래의 ARS와 같은 커뮤니케이션 경험 등을 종합적으로 활용할 수 있는, 진정한 의미의 소비자 관점에서의 옴니채널을 지원하지 않고, 현재 수준의 자연어처리 기술만을 가지고 만족스러운 고객경험을 제공하겠다는 포장과 시도는 꽤나 무모해 보인다.