중복 콘텐츠 및 SEO에 대한 궁극적인 가이드

게시 됨: 2022-02-13

중복 콘텐츠는 온라인에서 둘 이상의 장소에 나타나는 콘텐츠를 말합니다. "장소"는 고유한 URL이 있는 페이지를 의미합니다. 그것은 정확히 같은 콘텐츠일 수도 있고 거의 정확히 같을 수도 있으며, 같은 웹사이트나 다른 사이트에 있을 수도 있습니다.

기술적으로 Google은 중복 콘텐츠에 대해 불이익을 받지 않을 있지만 검색 엔진 순위에 영향을 줄 수 있습니다. 검색 엔진이 콘텐츠의 어느 위치가 가장 관련성이 있는지 파악하기 어렵기 때문입니다. 결과적으로 어떤 URL도 높은 순위를 차지하지 않으며 단일 페이지도 가능한 최고의 검색 가시성을 얻지 못합니다.

Google은 중복 콘텐츠를 감지하고 모든 URL을 하나의 클러스터로 그룹화한 다음 최상의 결과를 선택할 수 있어야 합니다. 그러나 이것이 항상 올바르게 작동하는 것은 아니며 잘못된 URL이 선택되었을 수 있습니다. 궁극적으로 웹 사이트 소유자는 중복 콘텐츠로 인해 순위가 낮아지거나 트래픽이 감소하는 것을 알 수 있습니다. 다행히도 이러한 종류의 일이 귀하의 사이트에서 발생하지 않도록 방지할 수 있는 방법이 있습니다.

중복 콘텐츠가 문제인 이유

중복 콘텐츠는 다음과 같은 여러 방식으로 검색 엔진과 사이트 소유자에게 영향을 미칩니다.

  • 검색 엔진은 색인에 포함하거나 포함하지 않을 URL을 모릅니다.
  • 검색 엔진은 링크 메트릭(권한, 신뢰 등)이 모두 한 페이지로 지정되어야 하는지 아니면 여러 페이지로 지정되어야 하는지 알지 못합니다.
  • SERP(검색 엔진 결과 페이지)에서 순위를 매길 URL이 명확하지 않으며 때로는 바람직하지 않은 URL이 정상적인 URL보다 순위가 높을 수 있습니다.
  • 콘텐츠에 대한 백링크를 포함하려는 다른 사이트는 여러 URL 중에서 선택해야 하기 때문에 링크 에퀴티(한 페이지가 다른 페이지로 전달하는 권한과 가치)가 희석됩니다. 그런 다음 링크 자산은 한 페이지에만 집중하는 대신 복제본 전체에 분산됩니다.

모두 귀하의 웹사이트로 연결되는 URL이 있더라도 사용자에게 친숙하지 않게 보이게 하는 링크 속성이 있고 Google이 원본 대신 해당 버전의 URL에 순위를 매긴다면 사람들은 해당 URL을 클릭하고 싶어하지 않을 수 있습니다. 예를 들어 yoursite.com/besttrailsyoursite.com/besttrails/?utm_content=buffer&utm_medium=social 보다 훨씬 매력적으로 보입니다. 하지만 구글이 중복 콘텐츠의 기본 버전이라고 생각해서 두 번째 콘텐츠로 순위를 매긴다면 사람들은 위협적이고 신뢰할 수 없어 보이기 때문에 클릭하지 않을 것이다.

또한 중복 콘텐츠가 있으면 웹사이트의 크롤링 "예산"이 소진됩니다. Google은 새로운 콘텐츠를 찾기 위해 웹사이트를 크롤링하고, 새로운 콘텐츠가 있는지 확인하기 위해 주기적으로 사이트를 다시 크롤링합니다. 사이트에 중복 콘텐츠가 있는 경우 모든 페이지를 철저히 크롤링하는 데 더 많은 시간이 소요됩니다. 이로 인해 Google이 페이지를 색인화하고 다시 색인화하여 검색 결과에 표시하는 시간표가 느려질 수 있습니다.

Google의 중복 콘텐츠 정책

구글에 따르면:

사이트의 중복 콘텐츠는 중복 콘텐츠의 의도가 기만적이고 검색 엔진 결과를 조작하는 것으로 보이지 않는 한 해당 사이트에 대한 조치의 근거가 되지 않습니다.

그러나 Google은 대부분의 중복 콘텐츠 인스턴스에 대해 웹사이트 소유자를 처벌하지 않지만 계속해서 다음과 같이 말합니다.

드물지만 Google에서는 순위를 조작하고 사용자를 속일 의도로 중복 콘텐츠가 표시될 수 있다고 판단하는 경우 관련 사이트의 색인 및 순위를 적절하게 조정할 것입니다. 결과적으로 사이트 순위가 저하되거나 사이트가 Google 색인에서 완전히 제거되어 더 이상 검색 결과에 나타나지 않을 수 있습니다.

Google은 사용자를 속이거나 검색 엔진 순위를 조작하려는 의도로 무엇을 간주할 수 있습니까? 의도적으로 도메인, 하위 도메인 및 페이지를 중복 콘텐츠로 만드는 것. 또한 스크랩한 콘텐츠를 게시합니다. 특히 다른 가치를 추가하지 않는 경우 더욱 그렇습니다.

하지만 기억하세요. Google이 공식적으로 귀하를 처벌하지 않거나 중복 콘텐츠가 악의적인 것으로 간주하지 않더라도 SEO 노력에 여전히 피해를 줄 수 있습니다. Google이 중복 콘텐츠 문제로 인해 사이트 순위 지정을 중단한 경우 문제가 수정되면 재검토 요청을 제출할 수 있습니다.

중복 콘텐츠가 발생하는 방식

일반적으로 웹사이트 소유자는 의도적으로 중복 콘텐츠를 만들지 않습니다. 그렇기 때문에 Google은 이를 너무 과감하게 처벌하지 않습니다. 이것이 복사된 콘텐츠와 복제된 콘텐츠의 차이점이기도 합니다.

복사된 콘텐츠 는 다른 웹사이트에서 정확한 문구를 가져와서 자체적으로 게시하는 경우입니다. 중복 콘텐츠 는 실수로 또는 자신도 모르는 사이에 온라인 어딘가에 다른 버전의 콘텐츠가 있는 경우를 말합니다.

여기에서는 중복 콘텐츠가 온라인에서 끝나는 일반적인 방법을 살펴보겠습니다. 그런 다음 콘텐츠 중복 문제를 해결하는 방법에 대해 이야기하겠습니다.

HTTP, HTTPS, WWW 및 비 WWW 페이지

예를 들어 사이트에 www.yoursite.comyoursite.com 과 같은 두 가지 버전이 있는 경우 동일한 콘텐츠가 사이트의 두 버전에 모두 있으므로 중복 콘텐츠가 있습니다. http://https:// 사이트도 마찬가지입니다.

쪽수 매기기

페이지 매김은 하나의 기사 또는 블로그 게시물의 댓글 섹션이 여러 페이지에 걸쳐 있을 때 발생할 수 있습니다. 또는 별도의 페이지에 각각의 이미지 갤러리가 있을 수 있습니다. 이러한 종류의 복제는 사용자가 계속 아래로 스크롤함에 따라 새로운 콘텐츠가 채워지는 무한 스크롤 페이지에서도 발생할 수 있습니다.

URL 변형

추적 코드 와 같은 URL 매개변수는 의도하지 않게 중복 콘텐츠를 생성할 수 있습니다. 예를 들어 웹사이트의 페이지는 yoursite.com/sneakers 일 수 있지만 사람들이 클릭한 위치를 확인하기 위한 추적 코드가 있는 경우 yoursite.com/newsletter?utm_source=newsletter 와 같이 보일 수 있습니다. Google 및 기타 검색 엔진이 이러한 중복 콘텐츠를 고려하지 않더라도 분석 플랫폼에서 여러 항목을 생성하는 별도의 매개변수를 처리해야 할 수도 있습니다.

세션 ID 는 동일한 효과를 가질 수 있습니다. 세션은 방문자가 장바구니에 무언가를 추가할 때와 같이 웹사이트에서 수행하는 작업에 대한 짧은 기록입니다. 장바구니가 그대로 유지되도록 사용자가 다른 페이지를 클릭하면 세션이 유지됩니다. 세션 ID는 해당 세션의 고유한 수정자이며 때때로 URL(yoursite.com?sessionId=jow8082345hnfn8456)에 저장됩니다. 이렇게 하면 동일한 페이지 콘텐츠로 여러 개의 서로 다른 URL을 만들 수 있습니다.

콘텐츠의 인쇄용 버전 이나 모바일용 버전이 있는 경우에도 마찬가지입니다. 검색 엔진은 동일한 콘텐츠의 여러 페이지가 있다고 생각합니다. 왜냐하면… 있기 때문입니다.

이는 전자 상거래 웹사이트, 특히 사용자가 검색 결과를 필터링할 때 흔히 발생합니다. URL은 거의 동일하게 유지되지만 끝에 크기나 색상과 같은 부록이 있습니다. 이를 패싯 또는 필터링된 탐색 이라고 합니다. 페이지의 콘텐츠는 거의 동일하지만 URL은 고유합니다.

후행 슬래시 라도 URL을 고유하게 만들 수 있습니다. 예: yoursite.com/pageyoursite.com/page/ . 이것이 중복 콘텐츠 문제를 일으키는지 확인하는 가장 빠른 방법은 페이지의 두 버전으로 이동하는 것입니다. 하나가로드되지 않으면 걱정할 필요가 없습니다. 그렇지 않으면 리디렉션이 옵션입니다(좀 더 자세히 설명).

중복 콘텐츠가 발생하는 더 많은 방법

  • 전자 상거래 제품 설명: 제품 에 대한 제조업체의 설명을 사용할 때 다른 전자 상거래 사이트에 중복 콘텐츠가 있는 것이 일반적입니다.
  • 이미지 첨부 페이지: 각 이미지 첨부 파일에 별도의 페이지가 있는 경우 중복 콘텐츠가 생성될 수 있습니다.
  • 검색 결과 페이지: yoursite.com?q=search-term 과 같은 매개변수를 검색 URL에 추가합니다.
  • 스테이징 환경: 테스트에 사용된 사이트의 복제 버전입니다.
  • 태그 및 카테고리 페이지: 태그 또는 카테고리를 사용하면 WordPress는 자동으로 전용 태그 및 카테고리 페이지를 생성합니다. 한 페이지에 여러 카테고리 또는 태그가 있는 경우 이로 인해 콘텐츠가 중복될 수 있습니다.

중복 콘텐츠를 수정하는 방법

위에 나열된 몇 가지 작은 문제의 경우 SEO 플러그인에서 도움이 되는 설정을 찾을 수 있습니다. 예를 들어, Yoast 플러그인에서 이미지에 대한 첨부 페이지 URL을 비활성화할 수 있습니다.

중복 콘텐츠

WordPress에는 댓글 페이지 매김을 끄는 내장 옵션도 있습니다.

중복 콘텐츠

그러나 다음 방법은 중복 콘텐츠 문제를 해결하는 주요 방법입니다.

1. 중복 콘텐츠 찾기

먼저 중복 콘텐츠의 인스턴스를 찾아야 합니다. Ahrefs Site Audit 및 Google Search Console과 같은 도구는 사이트를 크롤링하고 중복 콘텐츠 경고가 있는지 알려줄 수 있습니다.

사이트에서 특정 키워드에 대한 중복 콘텐츠를 찾으려면 다음을 Google에 입력할 수 있습니다.

사이트:yoursite.com 제목: 키워드

그러면 해당 키워드가 포함된 웹사이트의 모든 페이지가 표시됩니다. 좋은 경험 법칙은 특정 키워드를 검색하여 결과를 보다 쉽게 ​​훑어보는 것입니다.

온라인의 다른 곳에 복제된 특정 기사가 있다고 생각되면 Grammarly 또는 Copyscape와 같은 표절 검사기를 사용하여 정확히 일치하는 문장의 다른 인스턴스를 찾을 수 있습니다. 또는 전체 문장 한두 개를 Google에 붙여넣어 사이트가 아닌 다른 곳에 표시되는지 확인할 수 있습니다.

2. Canonicalization을 통해 콘텐츠의 URL 조정

온라인에 중복 콘텐츠가 있다는 것을 알게 되면 어떤 페이지를 유지해야 할지 결정할 때입니다.

검색 엔진에 대한 기본 페이지를 정규화합니다. 정규화는 URL이 페이지의 마스터 버전임을 검색 엔진에 알려줍니다. 페이지는 엔진에서 실행할 수 있는 중복 대신 검색 결과에 나타나야 합니다. 다음은 콘텐츠를 정규화하는 두 가지 방법입니다.

301 리디렉션

중복 페이지에서 기본 페이지로의 301 리디렉션을 만듭니다. 중복 페이지는 서로 경쟁을 중단하고 기본 페이지는 더 인기 있고 관련성이 높아져 순위가 더 높아집니다. WordPress로 리디렉션을 생성하는 방법에 대한 기사가 있습니다.

또한 리디렉션된 URL에서 새 대상으로 전송되는 링크 주스/페이지 권한의 추가 이점도 얻을 수 있습니다.

Rel="표준" 속성

이 속성을 통해 검색 엔진은 페이지가 URL의 사본이며 모든 링크, 메트릭 및 순위 결정력이 복사된 페이지가 아니라 지정된 기본 URL에 적용되어야 함을 알 수 있습니다. 속성은 초점을 맞추려는 원본 페이지에 대한 링크와 함께 각 중복 페이지의 HTML 헤드에 포함되어야 합니다. Google에는 속성을 추가하는 방법에 대해 자세히 설명하는 문서가 있으며 이를 보완하기 위해 표준 URL 및 WordPress에 대한 자세한 내용이 있습니다.

봇이 웹사이트 콘텐츠를 복사, 다운로드 및 다시 게시하는 콘텐츠 스크래핑을 방지하려면 자신의 웹페이지에 rel=”canonical” 속성을 추가하세요. 속성은 자체 참조적이며 현재 있는 URL을 가리킵니다. 콘텐츠가 스크랩되더라도 봇이 전체 HTML 코드를 이식하는 한 귀하의 버전은 여전히 ​​원본으로 간주됩니다.

3. Google Search Console을 사용하여 도메인 URL 조정

Google Search Console을 사용하면 www.yoursite.com 대신 yoursite.com 과 같이 웹사이트의 기본 도메인을 지정할 수 있습니다. 다른 URL 매개변수를 처리하는 방법을 Googlebot에 알릴 수도 있습니다. 이렇게 하면 중복 콘텐츠 문제의 일부 또는 전체가 해결될 수 있습니다. 하지만 Google에서만 가능합니다. 다른 검색 엔진에서는 그렇지 않습니다. Bing 및 Yandex와 같은 플랫폼에는 자체 웹마스터 도구가 있습니다.

중복 콘텐츠 방지 또는 수정을 위한 추가 팁

  1. 내부 링크를 추가할 때 예를 들어 www 가 있든 없든 동일한 버전의 도메인을 사용하십시오. 또한 항상 후행 슬래시가 있거나 없는 동일한 버전의 페이지를 사용하십시오. 어떤 구조를 선택하는지는 중요하지 않지만 일관성이 있습니다.
  2. 신디케이트된 콘텐츠를 준비하는 경우 콘텐츠를 사용하는 웹사이트는 원본 콘텐츠에 대한 백링크를 추가해야 합니다. URL의 변형이 아닙니다. 그러나 원래의 기본 표준 URL입니다.
  3. 빈 페이지를 자리 표시자로 게시하지 마십시오. 빈 페이지마다 색인이 생성되어 검색 엔진이 중복 콘텐츠가 많다고 생각할 수 있습니다.
  4. 유사한 콘텐츠의 양을 줄이십시오. 예를 들어 법률 웹사이트가 있고 해당 지역의 다른 카운티에 서비스를 제공한다고 가정해 보겠습니다. 개인 상해법과 같은 동일한 법률 주제에 대해 이야기하는 경우 각 카운티별 페이지에는 유사한 정보가 포함될 수 있습니다. 한 가지 옵션은 페이지를 두 카운티에 대한 더 큰 페이지로 병합하거나 페이지를 별도로 유지하기 위해 내용을 더 다양하게 할 수 있습니다.

중복 콘텐츠에 대한 최종 생각

소량의 중복 콘텐츠를 발견해도 일반적으로 걱정할 필요가 없습니다. 그러나 수백 또는 수천 페이지에 영향을 미치는 기술적인 문제는 처리해야 합니다. 또한 모든 중복 콘텐츠 문제를 해결하는 데 아무런 문제가 없습니다. 이는 깔끔한 고성능 사이트 운영의 일부일 뿐입니다. 결국, 당신이 하고 싶은 마지막 일은 당신이 완전히 통제할 수 있는 콘텐츠 때문에 자신과 경쟁하고 자신의 순위를 망치는 것입니다.

중복 콘텐츠를 파악한 후에는 중복 키워드 문제를 방지하기 위해 키워드 자기잠식을 처리하는 방법에 대한 기사를 확인할 수도 있습니다.

사이트의 중복 콘텐츠를 어떻게 처리했습니까? 댓글에서 실제 전략에 대해 이야기합시다!

NikAndr/Shutterstock.com의 기사 특집 이미지