Posts Tagged ‘Search Engine’

Win or Fail

재미있는 기사가 RWW에 있어서 살펴보았다.

What is The Future of Human Powered Search?“ 

Mahalo를 소개하면서 Human Powered Search Engines의 장단점에 대한 이야기를 하고 있다. 

Mahalo는 Social Search의 대표적인 형태로 이야기 되고 있는 검색엔진이다. Most popular search terms에 대해 사람들이 직접 컨텐츠를 생성하고, 조직화한다. 이를 위해 mahalo는 ‘greenhouse’ 프로그램을 통해 사람이 작성한 25,000(6월 통계이다)개의 검색결과 페이지를 확보하고 있다. – 현시점에서 사용자들이 가장 알고자 하는 내용에 대해서만 검색결과 페이지를 제공한다. 수많은 검색어중에 80에만 집중하는 것이다.

mahalo 이전에도 human powered search engines은 존재해왔다. 국내에서도 쉽게 살펴볼 수 있듯이 각 포털들의 directory 서비스가 human powered search engine라 할 수 있을 것이다. 각 서비스에 editor들이 존재하며, 사용자가 등록한 사이트들에 대해 리뷰 및 등록(?)을 통해 서비스하는 것이다.

또한 ODP(Open Directory Project) 역시 human powered search engine이다. 현재는 dmoz라는 이름으로 서비스되고 있는 이 프로젝트는 초기에 gnuhoo.org라는 URL을 가지고 있었다(지금도 이 url로 접속가능하다)

이 이름에서도 알 수 있듯이, 초기에는 yahoo!를 패러디하며 시작된 서비스이다. 대부분의 포털의 directory 서비스들은 자체의(closed) editors에 의해서 사이트가 등록되어 온 반면에(여전히 그렇다) ODP의 경우 초기에 누구나 다 directory의 editors가 될 수 있었다.

아마 DAUM에서 예전에 이 모델을 사용한적이 있었으나 실패(?)를 경험했었던 것 같다.

아무튼 다시 본론으로 돌아와,

Mahalo로 대표되는 human powered search engines(또는 Social Search Engines도 마찬가지라 생각된다)은 3개의 장점과 2개의 단점을 가지고 있다고 말한다.

3가지의 장점은,

  1. Spam Control
  2. Duplicate Control
  3. Disambiguration

이라고 설명하고 있다

2가지 단점은,

  1. You cannot persuade people to break their Google habit until your searches are better than Google for most cases (not just the few cases where you specialize). This massive hurdle is true for all search engines.
  2. You cannot win as a destination site if you are general purpose. You go to the sites that specialize in the areas that interest you. If you don’t know what sites to go to, Google will find those sites for you.

라고 설명하고 있다.

이는 현재 새로이 생겨나고 있는 모든 Search Engine Start-up들이 고민하고 있는 문제(자신들의 장점이자 단점)일 것이다. 그리고, 해결해야 할 문제이기도 하고… (-.-)b

What do you think? Can general purpose human powered search engines scale and make money? Or will they either fail or move into small niches? What new ventures have a fundamentally differentiated approach to this market?

어떻게 생각하시나요?

또 다른 관점에서의 접근 방식은 없을까?

Smart Data

noa님이 “검색엔진 어떻게 변화 될까?” 라는 글의 마지막 부분을 보며 든 생각.

noa님은 앞으로의 검색엔진의 모습을 다음과 같이 이야기 하고 계시다.

검색엔진은 사용자들의 생성해낸 데이터를 검색하기 위해서 그 사용자 성향을 분석하고, 그 사용자가 생성해낸 데이터를 분석 해야 할것이며, 그 사용자와 관련되어 있는 또다른 사용자까지 분석 해야 할것이다.
그러므로, 산재되어있는 UCC데이터는 SNS환경하에 있는 플랫폼으로 이동 될것으로 예상한다. 하지만, 순식간에 변화되진 않겠지만, 어떤 티핑포인트를  기점으로 급속하게 변화될것으로 예상한다. 그 기점이란 UCC데이터를 잘 정돈화 시킬수 있는 SNS환경의 출현이 그것이 될것이다.
이런 이유에 검색엔진은 정확도를 높이기 위해서는 문서 자체의 분석도 중요하겠지만, 그문서를 만들어 낸 사용자의 분석이 더 중요하게 될것이다.

사용자의 검색 행태(검색의도)는 오래전부터 연구되어오던 내용이다. 사용자의 search queries에 기반하여 사용자의 검색의도에 적합한 검색결과를 보여주는 것은 대부분의 search engine들이 지향하고 있는 모습니다.

사용자 생성 데이터를 잘 정돈화 시킬 수 있는 SNS 환경을 언급하셨는데, 이것이 Semantic Social Networking이 아닐까 하는 생각이 든다.(Data에 대한 search라는 관점에서…)

User Profiles, User Generated(Created) Contents등의 다양한 data들이 서로 의미적으로 연결되어 있는 Smart한 Data로 존재하게 된다면, 검색에 있어서도 좀 더 사용자의 needs에 적합한 검색결과를 보여줄 수 있을 것이다.

그리고 이러한 Smart Data는 SIOC(데이터의 구조와 컨텐츠를 구조화 할 수 있다)을 통해서 실질적으로 구현가능한 모습으로 만들어 갈 수 있을 거라고 생각된다.

Topicle : another Social Search Engine

예전에 슬쩍 기사를 봤었는데, 오늘 noa님의 post를 보고 나서야 생각이 났다.

첫 느낌은 Eurekster의 swicki와 비슷한 듯 한데, topicle이 훨씬 더 직관적인 것 같다. 

Swicki가 특정 topic에 대한 your own vertical search engine을 생성하여, 그 검색결과를 사용자의 참여를 통해 다듬어간다면 – 검색결과의 reordering, buzzcloud라는 사용자의 검색어 set을 통해 – , Topicle은 특정 Topic에 대한 특정 URL set를 생성하여 보다 집중화된 검색결과를 제공한다. 

둘 다 사용자의 참여을 통해 사용자가 원하는 topic에 대한 relevancy를 높이고 있다. 기존의 search engine이 noa님이 언급하신 GIGO의 형태였다면, Social Search Engines은 좀 더 세분화 – 전문화된 topic(Vertical)에 대해 architecture of participation의 형태를 추구하고 있는 것 같다.

아무튼, 새로운 검색 서비스들이 모습을 많이 들어내는 것은, 기존의 검색엔진에 대한 차별화된 또 다른 needs가 존재하고 있다는 현상의 반영인 것 같다. 재미있는 곳이다. =)

Return top

Sangwon Yang

현명한 사람이 되고 싶은 두 아이의 아빠