검색 동향 - 한국 검색 서비스 현황

한국의 검색 서비스 과거와 현재, 나아갈 방향에 대해서 구글의 검색 서비스와 비교하여 설명한다. ‘검색 서비스 개선에 대한 문제는 검색 기술의 문제일까?’, ‘검색 서비스 개선은 무엇을 위한 것인가?’에 대한 고민들이 정말 검색 서비스를 위해 있어왔는지 스스로 질문해봐야 한다. 쇼핑 검색 사례를 통해 이와 같은 질문에 답해본다.

얼마전 지인과 오랜만에 쇼핑 검색과 관련된 이야기를 하면서 검색엔진 회사를 그만둔지가 벌써 7년 여의 시간이 흘렀지만 그때와 지금의 검색 서비스는 사실 크게 달라진게 없음을 실감했다.

N사와 D사 외의 검색 서비스 포털은 인터넷 광고 등의 수익이 적자로 돌아서면서(사실 N사의 광고 수익 독점은 대단했다.) 하나 둘 문을 닫고 독점체제로 더욱 굳건해지다보니 검색 자체에 투자를 하기 보다는 어떻게 하면 광고를 더 많이 유치를 할지에 대한 광고 채널로써의 서비스 개선 고민이 더 많았던 것 같다. 모바일 광고 및 유튜브와 유사한 미디어 포털 까지 만들어가면서 값비싼 동영상 광고 유치 전쟁에 한창이니 말이다.

쇼핑 검색은 일부 해외 대형 기업 e사의 오픈마켓 독점과 이에 대항하기 위한 S사의 등장과 그 외 소셜커머스 서비스로 시장이 정리가 되다보니 사실상 검색이 해당 서비스를 차별화하기 수단이 된다기 보다는 물건을 미리 대량으로 저렴하게 매입해두고 이를 통한 핫딜 마케팅이 주를 이뤄오고 있다. (쇼핑 검색에서 검색의 혁신은 가히 제자리라고 해도 과연이 아닐 것 같다. 어쩌면 퇴보를 했는지도 모른다. 이 이유에 대해서는 다음 포스팅에서 자세히 다뤄보고자 한다.)

그럼에도 불구하고 검색을 통한 서비스 개선에 대한 니즈는 꾸준히 있는걸까? 혹은 해당 조직이 있으니 조직을 유지하기 위한 필사적인 움직임에 불과한걸까? (자리 보전이라도 해야되니 뭐라도 하자는 움직임인걸까...?)

재밌는 것은 해외의 경우에는 이러한 검색에 대한 변화가 우리나라와는 전혀 다른 양상으로 이어져 왔다는 것에 있다. 검색 기술을 더 고도화하고, 이를 다양한 분야에 상용화하기 위한 시도들이 있어왔는데, 가히 검색 서비스에 있어서는 타의 추종을 불허하는 구글의 검색 엔진 기술(형태소 기반의 인덱싱 기술)이 그 대표라 할 수 있다. 이를 활용해서 구글은 음성 인식에서부터 검색포털에 이르기까지 상당한 기술적, 서비스적 진전을 이어왔다. 특히 검색결과의 정확도는 검색이라는 것을 넘어 가히 예술이라 칭할만하다.

'사람이 말을 하는 그대로를 거의 틀림없이 정확하게 텍스트로 인식을 하다니...이게 가능해?'

결론은? 가능했다...

혹자는 그것이 가능한 것은 무한대에 가까운 구글의 컴퓨팅 파워가 있었기 때문이라고 하지만 필자는 근본적으로 검색이 나아가야할 방향성이 명확했기 때문에 가능했던 일이라고 생각한다. 검색이 정확한 검색결과를 제공하는 것 말고 뭐가 또 필요하겠는가?

반대로 검색 서비스를 기획/개발하는 당신에게 제한된 컴퓨팅 파워로 제한된 주제에 대해서라도 정확도를 높이고 검색결과를 최적화 하라면 당신은 정말로 그것을 할 수 있다고 믿고있는가?

Egg of Columbus
Egg of Columbus

구글은 음성인식 이외에도 포털 사이트(Google.com)의 검색은 페이지 링크 분석 방식을 통해서 연관성이 높은 검색결과를 노출하기로 유명한데, 이젠 이것이 정점에 오른 것 같은 느낌이 들 정도다. 어떠한 검색어와 다양한 검색어로 테스트를 해봐도 왠만해서는 검색결과 4~5번째 이내에서 내가 원하는 검색결과를 찾을 정도로 굉장히 신뢰할만한 페이지를 노출하고 있다. 이렇게 방대한 검색어와 방대한 자료를 이렇게나 빠른 속도로 정확한 검색결과를 제공한다는 게 그저 놀라울 따름이다.

여타의 검색엔진들이 키워드 매칭(검색어와 인덱싱된 데이터의 매칭)의 정확도를 검색의 핵심기술이라고 주구장장 외쳐댈 때, 구글은 새로운 방식으로 그 문제를 해결하며, 기술적 격차를 넓혀놓고 말았다. 이와 같은 방식의 검색엔진을 개발하라고 해도 사실 상 이를 기획하고 개발할 수 회사는 없을 것이다. 아니 기본적으로 구글만큼 성공할 수 있다는 확신이 들지 않을 것이다. (다시 말하지만 이것은 컴퓨팅 파워의 문제가 100%, 1000% 아니다.)

구글은 사용자들이 추상적으로 입력하는 제한된 검색어와 이와 단순히 매칭되는 검색결과를 보여주는 것이 얼마나 제한될 수 있는지에 대해서 벌써부터 고민을 하고 있었던 것이다.

예를 들어, 당신이 찾는 건 검색결과 페이지에 첨부된 이름없는 파일일수도 있고, 특정 텍스트를 포함하지 않는 오디오/비디오 스트림일 수도 있으며, URL 등일 수도 있는데, 텍스트 매칭에 의한 검색결과가 얼마나 제한될 수 밖에 없겠는가? 게다가 검색결과로 노출되는 페이지는 검색엔진이 검색을 잘 할 수 있도록 정교하게 작성되는 페이지만 있는 것은 아니다. 우리 모두가 기자고, 우리 모두가 국문법을 전공한 작가도 아니지 않는가? (사실 쇼핑 검색을 이야기 하는데 있어서 이 부분은 상당히 치명적이고 중요한 포인트가 될 수 있다. 예를 들어, 검색에 걸려들기 위해서 검색결과 페이지를 생산하는 생산자(판매자)들이 쓰레기 데이터를 메타데이터로 얼마나 많이 입력하고 있는지 당신은 이미 잘 알고 있을 것이다.)

한국의 검색 서비스를 이야기하면서 이리 지리멸렬한 논의를 하는 이유는 한국의 검색 서비스가 얼마만큼 검색 서비스에 대한 개념, 목표가 명확하게 정립이 되어 있지 않는지를 설명하기 위해 서두가 조금 길었다.

요지는 당신의 검색 서비스가 추구하는 바가 정확히 무엇에 있는지, 검색 서비스의 본질이 무엇이어야 하는지에 대해 조금만 생각해보면 아직도 검색 서비스가 나아갈 길과 아이디어들은 수도 없이 다양할 수 있다에 있다는 것에 있다. 여전히 우리가 검색해야 될 데이터는 지금도 여기저기서 생산이 되고 있으니까 말이다.

다음 포스팅에서는 한국의 쇼핑 검색 서비스를 예로 들어 검색에 대한 좀 더 심도있는 이야기를 하겠다.

댓글

인기 게시글

[오류해결] KMS 인증(Activation) 오류(error) 0xC004F017 문제 원인 및 해결 방법

[오류해결] 카카오톡 PC 버전 접속 오류(일시적인 장애이거나 네트워크 문제일 수 있습니다. 잠시 후 다시 이용해 주세요. 오류코드 70101, 11002, LL)와 다음(daum.net), 티스토리(tistory.com) 접속 오류(오류코드 DNS_PROBE_FINISHED_NXDOMAIN) 문제