2012. 2. 3. 18:25 웹전반(표준)
‘검색 최적화 전도사’ 나선 구글 3인방
[출처]
http://www.bloter.net/archives/94717
검색 시스템에서 가장 첫 단계가 웹문서 수집(크롤링)입니다. 그 다음은 색인과 순위 매기입니다. 일단, 크롤링하지 못하면 그 다음 단계는 무용지물입니다. 아무리 좋은 검색 알고리즘이 있어도 문서를 수집하지 못하면 색인과 순위 매기기는 시도조차 못하는 셈이죠. 한국의 웹 검색 품질이 좋지 않은 이유 중 하나가 바로 크롤링하기 어렵기 때문입니다.”
국내 웹사이트는 검색엔진이 접근하는 것을 막아두거나 검색엔진을 전혀 돕지 않는다는 이야기다. 대체로 국내 웹사이트는 검색엔진을 제어하는 robots.txt를 잘못 설정해서 검색엔진이 접근하지 못하는 형편이다. 정부기관 웹사이트의 상당수는 검색엔진의 접근을 막고 있다. 웹페이지 정보를 제대로 입력하지 않아 검색엔진이 웹문서를 수집해도 해당 페이지가 어떤 정보를 담고 있는지 파악하지 못하는 경우도 부지기수라고 3인방은 설명했다.
.... 생략 ....
http://www.bloter.net/archives/94717
검색 시스템에서 가장 첫 단계가 웹문서 수집(크롤링)입니다. 그 다음은 색인과 순위 매기입니다. 일단, 크롤링하지 못하면 그 다음 단계는 무용지물입니다. 아무리 좋은 검색 알고리즘이 있어도 문서를 수집하지 못하면 색인과 순위 매기기는 시도조차 못하는 셈이죠. 한국의 웹 검색 품질이 좋지 않은 이유 중 하나가 바로 크롤링하기 어렵기 때문입니다.”
국내 웹사이트는 검색엔진이 접근하는 것을 막아두거나 검색엔진을 전혀 돕지 않는다는 이야기다. 대체로 국내 웹사이트는 검색엔진을 제어하는 robots.txt를 잘못 설정해서 검색엔진이 접근하지 못하는 형편이다. 정부기관 웹사이트의 상당수는 검색엔진의 접근을 막고 있다. 웹페이지 정보를 제대로 입력하지 않아 검색엔진이 웹문서를 수집해도 해당 페이지가 어떤 정보를 담고 있는지 파악하지 못하는 경우도 부지기수라고 3인방은 설명했다.
.... 생략 ....
'웹전반(표준)' 카테고리의 다른 글
2장 머리글 (0) | 2012.03.06 |
---|---|
1장 리스트 (0) | 2012.02.28 |
구글의 귀뜸 " 검색에서 잘 노출 되려면..." (0) | 2012.02.01 |
[링크] UI 디자이너 및 기획자에게 필요한 stencil (0) | 2012.01.03 |
XHTML DTD, 네임스페이스, XML Prolog 등 (0) | 2012.01.01 |