O melhor guia para conteúdo duplicado e SEO
Publicados: 2022-02-13Conteúdo duplicado refere-se ao conteúdo que aparece online em mais de um lugar. Por "lugar", queremos dizer uma página com um URL exclusivo. Pode ser exatamente o mesmo conteúdo ou quase exatamente o mesmo, e pode estar no mesmo site ou em outro site.
Você pode não ser penalizado – tecnicamente – pelo Google por conteúdo duplicado, mas pode prejudicar sua classificação no mecanismo de pesquisa. Isso porque é difícil para os mecanismos de busca descobrir qual local do conteúdo é o mais relevante. Como resultado, nenhum dos URLs acaba tendo uma classificação alta e nenhuma página obtém a maior visibilidade de pesquisa possível.
O Google deve ser capaz de detectar conteúdo duplicado, agrupar todos os URLs em um cluster e escolher o melhor resultado. Mas isso nem sempre funciona corretamente, e a URL errada pode ser escolhida. Em última análise, os proprietários de sites podem notar classificações mais baixas ou tráfego reduzido devido ao conteúdo duplicado. Felizmente, existem maneiras de evitar que esse tipo de coisa aconteça com seus sites.
Por que conteúdo duplicado é um problema
O conteúdo duplicado afeta os mecanismos de pesquisa e os proprietários de sites de várias maneiras:
- Os mecanismos de pesquisa não sabem quais URLs incluir ou não incluir nos índices.
- Os mecanismos de pesquisa não sabem se as métricas de link (autoridade, confiança, etc.) devem ser direcionadas a uma página ou a várias páginas.
- Não está claro qual URL classificar nas SERPs (páginas de resultados do mecanismo de pesquisa) e, às vezes, o URL indesejável pode superar o legítimo.
- A equidade do link (a autoridade e o valor que uma página passa para outra) é diluída porque outros sites que desejam incluir um backlink para o conteúdo precisam escolher entre os vários URLs. O valor do link é então espalhado pelas duplicatas em vez de se concentrar em apenas uma página.
Mesmo com URLs que direcionam para seu site, se um tiver atributos de link que o tornem hostil para os usuários e o Google classificar essa versão do URL em vez do original, as pessoas podem não querer clicar nele. Por exemplo, yoursite.com/besttrails parece muito mais convidativo do que yoursite.com/besttrails/?utm_content=buffer&utm_medium=social . Mas se o Google classificar o segundo porque acha que é a versão principal do conteúdo duplicado, as pessoas não clicarão porque é intimidante e não parece confiável.
Além disso, o “orçamento” de rastreamento do seu site é usado quando você tem conteúdo duplicado. O Google rastreia sites para encontrar novos conteúdos, e o Google também rastreia sites periodicamente para ver se há algo novo. Se você tiver conteúdo duplicado em seu site, isso significa que levará mais tempo para rastrear minuciosamente todas as páginas. Isso pode levar a um cronograma mais lento para o Google indexar e reindexar páginas e mostrá-las nos resultados de pesquisa.
Política de conteúdo duplicado do Google
De acordo com o Google:
Conteúdo duplicado em um site não é motivo para ação nesse site, a menos que pareça que a intenção do conteúdo duplicado seja enganar e manipular os resultados do mecanismo de pesquisa.
No entanto, embora o Google não penalize os proprietários de sites pela maioria das instâncias de conteúdo duplicado, a empresa continua dizendo:
Nos raros casos em que o Google percebe que conteúdo duplicado pode ser exibido com a intenção de manipular nossas classificações e enganar nossos usuários, também faremos os ajustes apropriados na indexação e classificação dos sites envolvidos. Como resultado, a classificação do site pode ser prejudicada ou o site pode ser totalmente removido do índice do Google e, nesse caso, não aparecerá mais nos resultados de pesquisa.
O que o Google pode considerar uma intenção de enganar os usuários e/ou manipular as classificações dos mecanismos de pesquisa? Criar domínios, subdomínios e páginas intencionalmente com conteúdo duplicado. Além disso, publicar conteúdo copiado – especialmente se você não adicionar mais nada de valor a ele.
No entanto, lembre-se disso: mesmo que o Google não o penalize oficialmente ou considere seu conteúdo duplicado malicioso, isso ainda pode prejudicar seus esforços de SEO. Se o Google parou de classificar seu site devido a problemas de conteúdo duplicado, você poderá enviar uma solicitação de reconsideração assim que os problemas forem corrigidos.
Como o conteúdo duplicado acontece
Normalmente, o proprietário de um site não cria conteúdo duplicado propositalmente. É por isso que o Google não o penaliza muito drasticamente. Essa também é a diferença entre conteúdo copiado e conteúdo duplicado .
O conteúdo copiado é quando você pega o texto exato de outro site e o publica por conta própria. Conteúdo duplicado é quando você acidentalmente ou sem saber tem outra versão do seu próprio conteúdo em outro lugar online.
Aqui, veremos como o conteúdo duplicado acaba ficando online. Depois disso, falaremos sobre como resolver o problema de conteúdo duplicado.
Páginas HTTP, HTTPS, WWW e não WWW
Se o seu site tiver duas versões diferentes — www.seusite.com e seusite.com , por exemplo — o mesmo conteúdo estará nas duas versões do site, o que significa que há conteúdo duplicado. O mesmo vale para sites http:// e https:// .
Paginação
A paginação pode acontecer quando um artigo ou a seção de comentários de uma postagem de blog abrange várias páginas. Ou talvez haja uma galeria de imagens com cada uma em uma página separada. Esse tipo de duplicação também pode acontecer em uma página com rolagem infinita, onde o novo conteúdo é preenchido à medida que o usuário continua rolando para baixo.
Variações de URL
Parâmetros de URL, como códigos de acompanhamento , podem criar conteúdo duplicado inadvertidamente. Por exemplo, uma página em seu website pode ser yoursite.com/sneakers , mas se você tiver um código de acompanhamento para ver de onde as pessoas clicaram, ele poderá ser yoursite.com/newsletter?utm_source=newsletter . Mesmo que o Google e outros mecanismos de pesquisa não considerem esse conteúdo duplicado, você também pode ter que lidar com os parâmetros separados criando várias entradas em suas plataformas de análise.
IDs de sessão podem ter o mesmo efeito. Uma sessão é um pequeno histórico do que um visitante faz em um site, como quando adiciona algo ao carrinho de compras. A sessão permanece quando a pessoa clica em outras páginas para que seu carrinho permaneça intacto. O ID da sessão é o modificador exclusivo dessa sessão e, às vezes, é armazenado na URL (yoursite.com?sessionId=jow8082345hnfn8456). Isso pode criar vários URLs diferentes com o mesmo conteúdo da página.
O mesmo pode acontecer se você tiver uma versão do conteúdo para impressão ou para dispositivos móveis . Os mecanismos de pesquisa pensarão que existem várias páginas do mesmo conteúdo. Porque eles são.
Essa também é uma ocorrência comum em sites de comércio eletrônico, principalmente quando os usuários filtram os resultados da pesquisa. O URL permanece praticamente o mesmo, mas com um adendo no final, como o tamanho ou a cor. Isso é chamado de navegação facetada ou filtrada . O conteúdo das páginas é quase o mesmo, mas os URLs são únicos.
Mesmo as barras finais podem tornar um URL único. Por exemplo, seusite.com/page e seusite.com/page/ . A maneira mais rápida de ver se isso está causando um problema de conteúdo duplicado é acessar as duas versões de uma página. Se um não carregar, você não precisa se preocupar com isso. Caso contrário, o redirecionamento é uma opção (mais sobre isso daqui a pouco).

Mais maneiras de conteúdo duplicado acontecer
- Descrições de produtos de comércio eletrônico: é comum que diferentes sites de comércio eletrônico tenham conteúdo duplicado ao usar a descrição do fabricante de um produto.
- Páginas de anexo de imagem: quando cada anexo de imagem tem uma página separada, isso pode criar conteúdo duplicado.
- Páginas de resultados de pesquisa: adicionam um parâmetro ao URL de pesquisa, como yoursite.com?q=search-term .
- Ambiente de teste: esta é uma versão duplicada do seu site usada para teste.
- Páginas de tags e categorias: quando você usa uma tag ou categoria, o WordPress cria automaticamente páginas dedicadas de tags e categorias. Às vezes, isso pode causar conteúdo duplicado quando uma página tem várias categorias ou tags.
Como corrigir conteúdo duplicado
Para alguns dos problemas menores listados acima, você pode encontrar uma configuração em seu plugin de SEO que ajudará. Por exemplo, no plug-in Yoast, você pode desabilitar URLs de páginas de anexos para imagens:
O WordPress também possui uma opção integrada para desativar a paginação de comentários:
Caso contrário, porém, as práticas a seguir são as principais maneiras de resolver problemas de conteúdo duplicado.
1. Encontre o conteúdo duplicado
Primeiro, você precisa encontrar instâncias de conteúdo duplicado. Ferramentas como o Ahrefs Site Audit e o Google Search Console podem rastrear seu site e informar se há algum aviso de conteúdo duplicado.
Se você estiver tentando encontrar conteúdo duplicado em seu site para uma palavra-chave específica, digite isso no Google:
site:seusite.com título: palavra-chave
Você verá todas as páginas do seu site que incluem essa palavra-chave. Uma boa regra geral é pesquisar uma palavra-chave específica para que seja mais fácil vasculhar os resultados.
Se você acha que há um artigo específico que foi duplicado em outro lugar online, você pode usar um verificador de plágio como Grammarly ou Copyscape para encontrar outras instâncias de frases de correspondência exata. Ou você pode colar uma ou duas frases completas no Google para ver se ela aparece em outro lugar que não seja no seu site.
2. Ajuste a URL do Conteúdo através da Canonização
Depois de saber que há conteúdo duplicado online, é hora de determinar qual página é a principal a ser mantida.
Você canoniza essa página principal para os mecanismos de pesquisa. A canonização informa aos mecanismos de pesquisa que um URL é uma versão mestra de uma página — que essa página deve aparecer nos resultados da pesquisa em vez de qualquer duplicata que o mecanismo possa encontrar. Aqui estão duas maneiras de canonizar o conteúdo:
Redirecionamento 301
Crie um redirecionamento 301 da(s) página(s) duplicada(s) para a página principal. As páginas duplicadas deixarão de competir umas com as outras e a página principal se tornará mais popular e relevante, o que significa que começará a ter uma classificação mais alta. Temos um artigo sobre como criar redirecionamentos com o WordPress para ajudá-lo.
Você também ganha o benefício adicional de qualquer autoridade de página/suco de link da URL redirecionada sendo transferida para o novo destino também.
Atributo Rel=”canonical”
Esse atributo permite que os mecanismos de pesquisa saibam que uma página é uma cópia de um URL e que todos os links, métricas e poder de classificação devem ser aplicados ao URL principal especificado, não à página copiada. O atributo deve ser incluído no cabeçalho HTML de cada página duplicada com um link para a página original na qual você deseja focar. O Google tem documentação detalhada sobre como adicionar o atributo, e temos conteúdo mais detalhado sobre URLs canônicos e WordPress para complementar isso.
Para evitar a raspagem de conteúdo, que é quando os bots copiam, baixam e republicam o conteúdo do seu site, adicione o atributo rel=”canonical” às suas próprias páginas da web. O atributo será auto-referencial — apontará para a URL em que está atualmente. Mesmo que o conteúdo seja copiado, desde que os bots carreguem o código HTML completo, sua versão ainda será considerada a original.
3. Ajuste os URLs do seu domínio usando o Google Search Console
O Google Search Console permite designar o domínio preferido do seu site, como seusite.com em vez de www.seusite.com , por exemplo. Você também pode informar ao Googlebot como lidar com diferentes parâmetros de URL. Isso pode esclarecer alguns ou todos os seus problemas de conteúdo duplicado. Mas apenas com o Google. Não com outros motores de busca. Plataformas como Bing e Yandex têm suas próprias ferramentas para webmasters.
Mais dicas para prevenir ou corrigir conteúdo duplicado
- Ao adicionar links internos, use a mesma versão do domínio, seja com ou sem www , por exemplo. Também sempre use a mesma versão de uma página com ou sem uma barra final. Não importa qual estrutura você escolha, mas seja consistente com ela.
- Se você estiver organizando conteúdo distribuído, o site que estiver usando o conteúdo deve adicionar um backlink ao conteúdo original. Não é uma variação do URL. Mas o URL original, principal e canônico.
- Não publique páginas vazias como espaços reservados. Cada página vazia será indexada, o que pode fazer com que o mecanismo de pesquisa pense que você tem muito conteúdo duplicado.
- Reduza a quantidade de conteúdo semelhante que você tem. Por exemplo, digamos que você tenha um site jurídico e atenda a diferentes condados em sua área. Cada página específica do condado pode incluir informações semelhantes se você estiver falando sobre o mesmo tópico de lei, como lei de ferimento pessoal. Uma opção é mesclar a página em uma página maior sobre os dois condados, ou você pode variar mais o conteúdo para manter as páginas separadas.
Considerações finais sobre conteúdo duplicado
Encontrar uma pequena quantidade de conteúdo duplicado geralmente não é motivo de preocupação. Mas as questões técnicas que estão afetando centenas ou milhares de páginas precisam ser tratadas. Além disso, não vai doer para esclarecer todos e quaisquer problemas de conteúdo duplicado. Isso é apenas parte da execução de um site organizado e de alto desempenho. Afinal, a última coisa que você quer fazer é competir consigo mesmo e arruinar seu próprio ranking por causa do conteúdo sobre o qual você tem total controle.
Depois de descobrir o conteúdo duplicado, você também pode conferir nosso artigo sobre como lidar com a canibalização de palavras-chave para evitar problemas de palavras-chave duplicadas.
Como você conseguiu lidar com conteúdo duplicado em seus sites? Vamos falar sobre estratégias do mundo real nos comentários!
Imagem em destaque do artigo por NikAndr / shutterstock.com