한 차원 진화된 웹 검색 서비스가 나왔다
검색포털 엠파스(대표 박석봉)는 2년간의 노력끝에 순수 토종 기술로 개발한 '한국형 웹 문서 검색서비스'를 선보인다고 5일 밝혔다. 셀 수 없을 정도로 많은 웹 문서 중 중요도가 가장 높은 문서를 최상위에 노출시켜주는 새로운 웹 검색 서비스로 검색 결과의 신뢰도와 적합도를 대폭 향상 시켰다.
엠파스는 이를 위해 독자 기술로 개발한 ‘랭크 5’ 방식을 국내 최초로 도입했다. 검색 단어에 대한 웹 문서의 적합도를 수치화한 랭크 5 방식은 최초 검색 결과 상위 5개 문서 내에 사용자가 찾고자 하는 정보와 가장 근접한 결과를 보여준다는 것이 특징이다.
이를 위해 첫 정보 수집 단계부터 30억개 이상의 인터넷 주소(URL)를 평가하고 스팸 문서 등을 제거한 8억개 정도의 URL을 선별해 정보를 수집했다. 검색 단어의 활용 범주와 사이트의 적합성을 고려해 우선 선별 순위를 정하는 만큼 중요도가 높은 문서를 우선적으로 보여줄 수 있다는 것이 회사측 설명이다.
인터넷 웹 문서들이 서로 참조하는 방식을 분석해 페이지와 키워드간의 연관성을 수치화 하고 첨부 링크 종류, 링크 연관도 등의 가치를 평가했다. 또 데이터베이스의 업데이트 주기를 최소화해 수시로 추가되고 변경되는 웹의 변화를 검색 결과에 바로 반영할 수 있게끔 설계했다.
엠파스 박석봉 대표는 "최근 주류를 이루고 있는 UCC 검색의 경우 최신 정보라는 장점과 함께 신뢰도가 다소 떨어진다는 단점도 있었다"며 "이번 웹 문서 검색서비스는 UCC 검색의 최신성에 신뢰성이라는 날개를 달아 준 열린 검색의 완성판"이라고 말했다.
엠파스는 이를 위해 독자 기술로 개발한 ‘랭크 5’ 방식을 국내 최초로 도입했다. 검색 단어에 대한 웹 문서의 적합도를 수치화한 랭크 5 방식은 최초 검색 결과 상위 5개 문서 내에 사용자가 찾고자 하는 정보와 가장 근접한 결과를 보여준다는 것이 특징이다.
이를 위해 첫 정보 수집 단계부터 30억개 이상의 인터넷 주소(URL)를 평가하고 스팸 문서 등을 제거한 8억개 정도의 URL을 선별해 정보를 수집했다. 검색 단어의 활용 범주와 사이트의 적합성을 고려해 우선 선별 순위를 정하는 만큼 중요도가 높은 문서를 우선적으로 보여줄 수 있다는 것이 회사측 설명이다.
인터넷 웹 문서들이 서로 참조하는 방식을 분석해 페이지와 키워드간의 연관성을 수치화 하고 첨부 링크 종류, 링크 연관도 등의 가치를 평가했다. 또 데이터베이스의 업데이트 주기를 최소화해 수시로 추가되고 변경되는 웹의 변화를 검색 결과에 바로 반영할 수 있게끔 설계했다.
엠파스 박석봉 대표는 "최근 주류를 이루고 있는 UCC 검색의 경우 최신 정보라는 장점과 함께 신뢰도가 다소 떨어진다는 단점도 있었다"며 "이번 웹 문서 검색서비스는 UCC 검색의 최신성에 신뢰성이라는 날개를 달아 준 열린 검색의 완성판"이라고 말했다.
이 기사를 공유합니다
저작권자 © 뉴스타운 무단전재 및 재배포 금지
뉴스타운
뉴스타운TV 구독 및 시청료 후원하기
뉴스타운TV