[웹과 웹 검색] (3-3) 웹 검색의 이해: 검색 결과

웹과 웹 검색 시리즈 읽기
1. 웹이란 무엇인가
2. 웹의 역사
3-1. 웹 검색의 이해: 정보의 수집
3-2. 웹 검색의 이해: 색인
3-3. 웹 검색의 이해: 검색 결과

앞서 설명해 드린 정보를 수집하고 색인을 만드는 작업은 사실 검색 서비스를 제공하기 위한 준비 과정에 불과합니다. 진정한 검색은 사용자의 손끝에서 검색을 요청하는 순간 이루어집니다. 여러분이 휴대폰이나 컴퓨터에서 네모난 창에 검색어를 넣고 검색 버튼을 누르면, 마치 검색할 줄 알았다는 듯이 검색에 대한 결과가 주르륵 나오는데요, 짧은 순간이지만 보이지 않는 곳에서 많은 작업이 이루어집니다.

사용자가 ‘웹에서 내가 원하는 정보를 찾아줘’라며 검색 엔진에 보내는 요청을 ‘쿼리(query)’라고 합니다. (‘쿼리’란 ‘질문하다’라는 의미입니다.) 사용자가 검색어를 입력하고 검색을 요청하면 ‘쿼리’라는 것이 만들어져, 인터넷을 통해 검색 엔진에 전달됩니다. 질문을 받은 검색 엔진은 재빠르게 색인을 뒤져서 해당 검색어와 관련된 정보가 웹의 어디에 있는지 알아냅니다. 그리고 그 정보를 가장 연관이 있다고 생각하는 순서대로 내용을 보여줍니다.

상위 노출을 원하세요?

검색 결과에 보여줄 정보의 순서를 결정하는 과정을 ‘랭킹(ranking)’이라고 부릅니다. 랭킹 작업은 다음의 두 단계를 거칩니다.

  • 주어진 검색어와 연관된 정보를 색인에서 모조리 찾아내는 것
  • 그렇게 찾아낸 정보 중 어느 것이 사용자가 원하는 것인가를 결정하는 것

순위를 매기는 방법을 ‘검색 알고리즘’이라고 부르는데, 검색 엔진마다 다른 방법을 사용하고, 대개 비밀에 부쳐져 있습니다. 검색 알고리즘이 비밀인 이유는 여러 가지 이유가 있는데, 가장 큰 이유를 두 가지만 들자면:

  • 첫째, 얼마나 사용자가 원하는 정보를 정확하게 전달하느냐가 검색 엔진의 경쟁력과 비례하기 때문입니다.
  • 둘째, 본인의 콘텐츠가 검색 결과의 상위에 나타나길 원하는 사람들이 랭킹 기술에 대한 정보를 악용하여, 검색어와 관련이 없는 콘텐츠를 검색 결과에 나타나게 하려는 기술적인 시도를 방지하기 위함입니다.

그래서 ‘내 사이트의 정보가 상위에 등록되게 하려면 어떻게 해야 합니까’라는 질문을 하여도 답을 얻는 것은 매우 어려운 일입니다.

그런데 꼭 비밀이 아니어도 이 질문에 답을 얻기 힘든 이유가 또 있는데요, 랭킹 기술이 하루가 멀다하고 바뀌기 때문입니다. 랭킹 기술이 바뀌어야만 하는 이유는:

  • 어느 검색 엔진도 완벽할 수 없으므로 계속 발전할 여지가 있고,
  • ‘어느 것이 사용자가 원하는 것인가’라는 질문의 답이 항상 바뀌고,
  • 웹이 끊임없이 진화하기 때문입니다.

그래서 검색 엔진을 만드는 기술자들은 바뀌는 웹 환경에 맞추어 매일 같이 새로운 기술을 도입하고 기존의 방법을 쉴 새 없이 바꾸어서, 사용자가 더 만족할 수 있는 검색 결과를 보여주려 애쓰고 있습니다. 예를 들면 구글의 경우 1년에 검색 알고리즘을 개선하기 위한 6만 개의 아이디어를 실험하고, 그중 500개 정도를 채택한다고 합니다. 1년이 365일이니 하루 평균 1개 남짓의 변화가 있는 셈입니다. 거기에 구글은 널리 알려진 페이지랭크 등, 200여 개의 신호를 사용하여 검색 결과를 도출하는 것으로 알려졌습니다.

그러니까 검색 알고리즘은 매일같이 변하고, 또 복잡하므로 구글에서 수년을 일한 검색 팀의 엔지니어도 현재의 구글 검색 알고리즘은 알지 못할 것입니다. 알고리즘만 다를 뿐, 네이버, 다음, 빙 등 다른 검색 엔진의 경우도 이는 마찬가지일 것입니다.

하지만 한 가지 변하지 않는 것이 있는데, 검색 엔진에게 랭킹의 목적은 어느 것이 사용자가 원하는 것인가를 알아내는 것입니다. 그리고 사용자는 본인이 찾는 것과 가장 연관이 있는 질 좋은 콘텐츠를 원합니다. 그러므로 검색 엔진은 더 좋은 콘텐츠를 웹에서 찾아서 사용자에게 보여주는 방향으로 진화합니다.

규칙을 악용하고 편법을 쓰는 웹 페이지가 아닌, 모두가 인정하는 좋은 콘텐츠를 지닌 페이지가 1위가 되어야합니다.규칙을 악용하고 편법을 쓰는 웹 페이지가 아닌, 모두가 인정하는 좋은 콘텐츠를 지닌 페이지가 1위가 되어야합니다.

본인의 콘텐츠가 상위에 검색되는 것을 원하세요? 그렇다면 검색 알고리즘을 파헤치려는 것보다, 검색하는 사용자 입장에서 더 만족할 수 있는, 좋은 콘텐츠란 무엇일까 고민하는 것이 더 의미 있을 것입니다. 방문자가 좋아할 만한, 유용하고 독자적인 콘텐츠를 만들고, 이것이 검색에 올바르게 나타나기 위해 노력하는 것이 정답입니다.

최성철, 구글 소프트웨어 엔지니어

This entry was posted in 웹과 웹 검색 and tagged , , , , . Bookmark the permalink.

One Response to "[웹과 웹 검색] (3-3) 웹 검색의 이해: 검색 결과"

Leave a Reply

Your email address will not be published. Required fields are marked *


*