검색 엔진 인덱싱 작동 방식의 기본 사항

게시 됨: 2022-04-17

검색 엔진 최적화(SEO)는 웹사이트의 가시성을 높이고 더 많은 유기적 트래픽을 끌어들이는 필수적인 방법입니다. 그러나 알고리즘을 이해하고 다양한 순위 요소를 활용하는 복잡한 전략입니다. SEO 전문가가 되려면 검색 엔진 인덱싱을 이해해야 합니다.

이 게시물에서는 검색 엔진이 웹사이트를 색인화하는 방법과 순위를 높이는 방법에 대해 설명합니다. 또한 이 SEO 개념에 대한 몇 가지 자주 묻는 질문에 답할 것입니다. 시작하자!

검색 엔진 인덱싱이란 무엇입니까?

검색 엔진 인덱싱은 검색 엔진(예: Google)이 중앙 데이터베이스(인덱스)에 온라인 콘텐츠를 구성하고 저장하는 프로세스를 나타냅니다. 그런 다음 검색 엔진은 콘텐츠를 분석 및 이해하고 SERP(검색 엔진 결과 페이지)의 순위 목록에 있는 독자에게 콘텐츠를 제공할 수 있습니다.

웹사이트를 인덱싱하기 전에 검색 엔진은 "크롤러"를 사용하여 링크와 콘텐츠를 조사합니다. 그런 다음 검색 엔진은 크롤링된 콘텐츠를 가져와 데이터베이스에 구성합니다.

검색 엔진 인덱싱에 대해 설명했습니다.

이미지 출처: Seobility – 라이선스: CC BY-SA 4.0

이 프로세스가 어떻게 작동하는지 다음 섹션에서 자세히 살펴보겠습니다. 지금은 색인을 웹사이트 게시물 및 페이지, 비디오, 이미지 및 기타 콘텐츠에 대한 온라인 파일링 시스템으로 생각하는 것이 도움이 될 수 있습니다. Google의 경우 이 시스템은 Google 색인으로 알려진 거대한 데이터베이스입니다.

검색 엔진은 사이트를 어떻게 색인화합니까?

Google과 같은 검색 엔진은 "크롤러"를 사용하여 온라인 콘텐츠를 탐색하고 분류합니다. 이러한 크롤러는 링크를 따라가고, 웹페이지를 스캔하고, 웹사이트에 대한 최대한 많은 데이터를 얻는 소프트웨어 봇입니다. 그런 다음 색인을 생성할 검색 엔진의 서버에 정보를 전달합니다.

검색 엔진 크롤러

이미지 출처: Seobility – 라이선스: CC BY-SA 4.0

콘텐츠가 게시되거나 업데이트될 때마다 검색 엔진은 콘텐츠를 크롤링하고 인덱싱하여 해당 정보를 데이터베이스에 추가합니다. 이 프로세스는 자동으로 수행될 수 있지만 사이트맵을 검색 엔진에 제출하면 속도를 높일 수 있습니다. 이 문서는 검색 엔진이 콘텐츠를 보다 효과적으로 크롤링하고 이해하는 데 도움이 되는 링크를 포함하여 웹사이트의 인프라를 간략하게 설명합니다.

검색 엔진 크롤러는 "크롤링 예산"으로 작동합니다. 이 예산은 봇이 정해진 기간 내에 웹사이트에서 크롤링하고 색인을 생성하는 페이지 수를 제한합니다. (그러나 그들은 돌아옵니다.)

크롤러는 키워드, 게시 날짜, 이미지 및 비디오 파일과 같은 필수 데이터에 대한 정보를 컴파일합니다. 검색 엔진은 또한 내부 링크와 외부 URL을 추적하고 색인을 생성하여 서로 다른 페이지와 웹사이트 간의 관계를 분석합니다.

검색 엔진 크롤러는 웹사이트의 모든 URL을 추적하지 않습니다. 그들은 자동으로 dofollow 링크를 크롤링하고 상응하는 nofollow를 무시합니다. 따라서 링크 구축 노력에서 dofollow 링크에 집중하고 싶을 것입니다. 귀하의 콘텐츠를 가리키는 외부 사이트의 URL입니다.

외부 링크가 고품질 소스에서 온 경우 크롤러가 다른 사이트에서 귀하의 사이트로 링크를 따라갈 때 "링크 주스"를 따라 전달됩니다. 따라서 다음 URL은 SERP에서 순위를 높일 수 있습니다.

링크 주스

이미지 출처: Seobility – 라이선스: CC BY-SA 4.0

또한 일부 콘텐츠는 검색 엔진에서 크롤링할 수 없습니다. 페이지가 로그인 양식, 비밀번호 뒤에 숨겨져 있거나 이미지에 텍스트가 포함된 경우 검색 엔진은 해당 콘텐츠에 액세스하고 색인을 생성할 수 없습니다. (그러나 대체 텍스트를 사용하여 이러한 이미지가 검색에 자체적으로 나타나도록 할 수 있습니다.)

검색 엔진 인덱싱을 위한 4가지 도구

여러 도구를 사용하여 Google 및 기타 검색 엔진이 콘텐츠를 크롤링하고 색인을 생성하는 방법을 안내할 수 있습니다. 가장 유용한 몇 가지 옵션을 살펴보겠습니다!

1. 사이트맵

사이트맵에는 XML과 HTML의 두 가지 종류가 있습니다. 이 두 개념은 모두 -ML 로 끝나는 사이트맵 유형이기 때문에 혼동하기 쉬울 수 있지만 서로 다른 용도로 사용됩니다.

HTML 사이트맵은 웹사이트의 모든 콘텐츠를 나열하는 사용자 친화적인 파일입니다. 예를 들어 일반적으로 사이트 바닥글에서 이러한 사이트맵 중 하나를 찾을 수 있습니다. Apple.com에서 아래로 스크롤하면 다음과 같은 HTML 사이트맵을 찾을 수 있습니다.

Apple 웹사이트에 있는 HTML 사이트맵의 예

이 사이트맵을 사용하면 방문자 가 웹사이트를 쉽게 탐색할 수 있습니다. 일반 디렉토리 역할을 하며 SEO에 긍정적인 영향을 미치고 견고한 사용자 경험(UX)을 제공할 수 있습니다.

대조적으로 XML 사이트맵에는 웹사이트의 모든 필수 페이지 목록이 포함되어 있습니다. 이 문서를 검색 엔진에 제출하면 검색 엔진이 콘텐츠를 보다 효과적으로 크롤링하고 색인을 생성할 수 있습니다.

XML 사이트맵의 예

이 기사에서 사이트맵에 대해 이야기할 때 XML 문서를 참조한다는 점을 염두에 두십시오. 또한 다양한 검색 엔진에서 사용할 수 있도록 문서를 준비할 수 있도록 XML 사이트맵 생성에 대한 가이드를 확인하는 것이 좋습니다.

2. 구글 서치 콘솔

SEO 노력을 Google에 집중하고 싶다면 Google Search Console이 필수 도구입니다.

구글 서치 콘솔.

콘솔에서 색인 범위 보고서에 액세스할 수 있습니다. 이 보고서는 Google에서 색인을 생성한 페이지를 알려주고 프로세스 중 문제를 강조표시합니다. 여기에서 문제 URL을 분석하고 문제를 해결하여 "인덱싱 가능"하게 만들 수 있습니다.

또한 XML 사이트맵을 Google Search Console에 제출할 수 있습니다. 이 문서는 "로드맵" 역할을 하며 Google에서 콘텐츠를 보다 효과적으로 색인화하는 데 도움이 됩니다. 또한 Google 크롤러가 사이트로 돌아올 때까지 기다리지 않고도 업데이트된 주제를 잠재고객이 항상 사용할 수 있도록 특정 URL과 사이트 일부를 다시 크롤링하도록 Google에 요청할 수 있습니다.

3. 대체 검색 엔진 콘솔

Google이 가장 인기 있는 검색 엔진이지만 유일한 옵션은 아닙니다. 자신을 Google로 제한하면 Bing과 같은 대체 소스의 트래픽에 대해 사이트가 폐쇄될 수 있습니다.

빙

Bing 웹마스터 도구 및 Yandex 웹마스터 도구에 XML 사이트맵 제출에 대한 가이드를 확인하는 것이 좋습니다. 유감스럽게도 Yahoo 및 DuckDuckGo를 포함한 다른 검색 엔진에서는 사이트맵을 제출할 수 없습니다.

이러한 각 콘솔은 SERP에서 사이트의 인덱싱 및 순위를 모니터링하기 위한 고유한 도구를 제공합니다. 따라서 SEO 전략을 확장하려는 경우 시도해 볼 것을 권장합니다.

4. Robots.txt

사이트맵을 사용하여 검색 엔진에 웹사이트의 특정 페이지를 인덱싱하도록 지시하는 방법은 이미 다루었습니다. 또한 robots.txt 파일을 사용하여 특정 콘텐츠를 제외할 수 있습니다.

robots.txt 파일에는 사이트에 대한 색인 생성 정보가 포함되어 있습니다. 루트 디렉토리에 저장되며 검색 엔진 크롤러를 지정하는 user-agent 행과 특정 파일을 차단하는 disallow 지시문이라는 두 개의 행이 있습니다.

예를 들어 robots.txt 파일은 다음과 같을 수 있습니다.

 사용자 에이전트: *
허용하지 않음: /example_page/
허용하지 않음: /example_page_2/

이 예에서 * 는 모든 검색 엔진 크롤러를 포함합니다. 그런 다음, 허용되지 않는 행은 특정 파일 또는 URL 경로를 지정합니다.

간단한 텍스트 파일을 만들고 이름을 robots.txt 로 지정하기만 하면 됩니다. 그런 다음 허용되지 않는 데이터를 추가하고 FTP(파일 전송 프로토콜) 클라이언트를 사용하여 루트 디렉터리에 파일을 업로드합니다.

자주 묻는 질문

지금까지 검색 엔진 인덱싱의 기본 사항에 대해 알아보았습니다. 이 SEO 개념에 대해 여전히 질문이 있는 경우 여기에서 답변해 드리겠습니다! (아직 가지고 계신다면 댓글로 알려주시면 답변해드리겠습니다!)

검색 엔진에서 어떻게 더 나은 색인을 얻을 수 있습니까?

사이트맵을 만들고 크롤링 오류에 대해 감사하고 여러 검색 엔진에 제출하면 검색 엔진에서 더 나은 색인을 생성할 수 있습니다. 또한 모바일 장치에 맞게 콘텐츠를 최적화하고 로딩 시간을 줄여 크롤링 및 인덱싱 속도를 높이는 것을 고려해야 합니다.

콘텐츠를 자주 업데이트하면 검색 엔진이 "새" 페이지를 크롤링하고 색인을 생성하도록 경고할 수도 있습니다. 마지막으로 robots.txt 파일을 사용하거나 삭제하여 검색 엔진이 중복 콘텐츠를 크롤링하지 못하도록 하는 것이 좋습니다.

내 사이트를 크롤링하려면 검색 엔진을 요청해야 합니까?

검색 엔진은 인터넷에서 공개적으로 사용 가능한 새로운 콘텐츠를 크롤링하지만 이 프로세스는 몇 주 또는 몇 달이 걸릴 수 있습니다. 따라서 선택한 검색 엔진에 사이트맵을 제출하여 작업 속도를 높이는 것을 선호할 수 있습니다.

새 콘텐츠를 게시하면 검색 엔진에 경고해야 합니까?

새 콘텐츠를 게시할 때 사이트맵을 업데이트하는 것이 좋습니다. 이 접근 방식을 사용하면 게시물이 더 빨리 크롤링되고 색인이 생성됩니다. 사이트맵을 쉽게 생성하려면 Yoast SEO와 같은 플러그인을 사용하는 것이 좋습니다.

내 콘텐츠가 Google 또는 다른 검색 엔진에서 제거된 적이 있습니까?

콘텐츠가 서비스 약관을 위반하는 경우 Google은 색인에서 게시물이나 페이지를 삭제할 수 있습니다. 이는 콘텐츠가 많은 경우 개인 정보 보호, 명예 훼손, 저작권 또는 기타 법률을 위반함을 의미합니다. 또한 Google은 식별 가능한 금융 또는 의료 정보와 같은 개인 데이터를 색인에서 제거합니다. 마지막으로 Google은 블랙햇 SEO 기술을 사용하는 페이지에 불이익을 줄 수 있습니다.

내 콘텐츠가 제거된 경우 어떻게 다시 색인을 생성할 수 있습니까?

검색 엔진의 웹마스터 품질 가이드라인을 충족하도록 콘텐츠를 수정하여 Google에 다시 색인을 생성하도록 요청할 수 있습니다. 그런 다음 재검토 요청을 제출하고 Google의 응답을 기다리면 됩니다.

검색 엔진이 특정 페이지를 인덱싱하지 못하도록 하려면 어떻게 해야 합니까?

페이지의 <head> 섹션에 noindex 메타태그를 추가하여 검색 엔진이 특정 페이지를 인덱싱하는 것을 방지할 수 있습니다. 또는 콘텐츠가 미디어 파일인 경우 robots.txt 파일에 추가할 수 있습니다. 마지막으로 Google 웹마스터 도구를 사용하면 URL 제거 도구를 사용하여 페이지를 숨길 수 있습니다.

결론

SEO는 검색 엔진 알고리즘에서 오프 페이지 최적화 기술에 이르기까지 모든 것을 다루는 광범위한 분야입니다. 주제를 처음 접하는 경우 모든 정보에 압도당할 수 있습니다. 다행히 인덱싱은 이해하기 쉬운 개념 중 하나입니다.

검색 엔진 인덱싱은 웹사이트의 콘텐츠를 중앙 데이터베이스로 구성하는 필수 프로세스입니다. 검색 엔진 크롤러는 사이트의 콘텐츠와 아키텍처를 분석하여 분류합니다. 그런 다음 특정 검색어에 대해 결과 페이지에서 페이지의 순위를 지정할 수 있습니다.

검색 엔진 인덱싱에 대해 다른 질문이 있습니까? 아래 의견 섹션에서 알려주십시오!

Sammby/Shutterstock.com을 통한 추천 이미지