คู่มือขั้นสูงในการทำซ้ำเนื้อหาและ SEO

เผยแพร่แล้ว: 2022-02-13

เนื้อหาที่ซ้ำกันหมายถึงเนื้อหาที่ปรากฏทางออนไลน์มากกว่าหนึ่งแห่ง โดย "สถานที่" เราหมายถึงหน้าที่มี URL เฉพาะ อาจเป็นเนื้อหาเดียวกันทุกประการหรือ เกือบจะ เหมือนกันทุกประการ และอาจอยู่ในเว็บไซต์เดียวกันหรือในเว็บไซต์อื่น

คุณอาจไม่ถูกลงโทษ — ในทางเทคนิค — โดย Google สำหรับเนื้อหาที่ซ้ำกัน แต่ อาจ ส่งผลเสียต่ออันดับเครื่องมือค้นหาของคุณ นั่นเป็นเพราะมันยากสำหรับเสิร์ชเอ็นจิ้นที่จะทราบว่าตำแหน่งของเนื้อหาใดมีความเกี่ยวข้องมากที่สุด ด้วยเหตุนี้ จึงไม่มี URL ใดที่มีอันดับสูง และไม่มีหน้าใดที่จะปรากฏในการค้นหาสูงสุด

Google ควรจะสามารถตรวจจับเนื้อหาที่ซ้ำกัน จัดกลุ่ม URL ทั้งหมดเป็นคลัสเตอร์เดียว จากนั้นเลือกผลลัพธ์ที่ดีที่สุด แต่วิธีนี้ใช้ไม่ได้ผลเสมอไป และอาจเลือก URL ที่ไม่ถูกต้อง ในที่สุด เจ้าของเว็บไซต์อาจสังเกตเห็นอันดับที่ต่ำกว่าหรือปริมาณการใช้งานลดลงเนื่องจากเนื้อหาที่ซ้ำกัน โชคดีที่มีวิธีป้องกันไม่ให้สิ่งนี้เกิดขึ้นกับเว็บไซต์ของคุณ

เหตุใดเนื้อหาที่ซ้ำกันจึงเป็นปัญหา

เนื้อหาที่ซ้ำกันส่งผลกระทบต่อเครื่องมือค้นหาและเจ้าของไซต์ในหลายวิธี:

  • เครื่องมือค้นหาไม่ทราบว่า URL ใดที่จะรวมหรือไม่รวมไว้ในดัชนี
  • เสิร์ชเอ็นจิ้นไม่ทราบว่าเมตริกของลิงก์ (อำนาจ ความเชื่อถือ ฯลฯ) ควรถูกนำไปยังหน้าเดียวหรือหลายหน้า
  • ไม่ชัดเจนว่า URL ใดที่จะจัดอันดับใน SERP (หน้าผลลัพธ์ของเครื่องมือค้นหา) และบางครั้ง URL ที่ไม่ต้องการอาจอยู่เหนือกว่า URL ที่ถูกกฎหมาย
  • ความเท่าเทียมกันของลิงก์ (อำนาจและคุณค่าที่หน้าหนึ่งส่งไปยังอีกหน้าหนึ่ง) จะลดลงเนื่องจากเว็บไซต์อื่น ๆ ที่ต้องการรวมลิงก์ย้อนกลับไปยังเนื้อหาต้องเลือกระหว่าง URL หลายรายการ ส่วนของลิงก์จะกระจายไปทั่วรายการที่ซ้ำกันแทนที่จะเน้นที่หน้าเดียว

แม้ว่าจะมี URL ที่นำไปยังเว็บไซต์ของคุณทั้งหมด แต่หากมีแอตทริบิวต์ของลิงก์ที่ทำให้ผู้ใช้ดูไม่เป็นมิตร และ Google จัดอันดับ URL เวอร์ชันนั้นแทนที่จะเป็นต้นฉบับ ผู้คนอาจไม่ต้องการคลิก ตัวอย่างเช่น yoursite.com/besttrails ดูน่าดึงดูดใจมากกว่า yoursite.com/besttrails/?utm_content=buffer&utm_medium=social มาก แต่ถ้า Google อยู่ในอันดับที่สองเพราะคิดว่าเป็นเวอร์ชันหลักของเนื้อหาที่ซ้ำกัน คนจะไม่คลิกเพราะเป็นการข่มขู่และดูไม่น่าไว้วางใจ

นอกจากนี้ "งบประมาณ" การรวบรวมข้อมูลของเว็บไซต์ของคุณยังถูกใช้จนหมดเมื่อคุณมีเนื้อหาที่ซ้ำกัน Google รวบรวมข้อมูลเว็บไซต์เพื่อค้นหาเนื้อหาใหม่ และ Google ยังรวบรวมข้อมูลเว็บไซต์ซ้ำเป็นระยะเพื่อดูว่ามีอะไรใหม่หรือไม่ หากคุณมีเนื้อหาที่ซ้ำกันในไซต์ของคุณ นั่นหมายความว่าจะใช้เวลามากขึ้นในการรวบรวมข้อมูลหน้าทั้งหมดอย่างละเอียด ซึ่งอาจนำไปสู่ตารางเวลาที่ช้าลงสำหรับ Google ในการจัดทำดัชนีและจัดทำดัชนีหน้าใหม่และแสดงในผลการค้นหา

นโยบายเนื้อหาที่ซ้ำกันของ Google

ตามที่ Google:

เนื้อหาที่ซ้ำกันบนไซต์ไม่ใช่เหตุผลสำหรับการดำเนินการบนไซต์นั้น เว้นแต่จะดูเหมือนว่ามีเจตนาของเนื้อหาที่ซ้ำกันเพื่อหลอกลวงและจัดการผลลัพธ์ของเครื่องมือค้นหา

อย่างไรก็ตาม แม้ว่า Google จะไม่ลงโทษเจ้าของเว็บไซต์สำหรับเนื้อหาที่ซ้ำกันส่วนใหญ่ แต่บริษัทยังคงกล่าวต่อไปว่า:

ในบางกรณีซึ่งเกิดขึ้นไม่บ่อยนักซึ่ง Google เห็นว่าอาจมีการแสดงเนื้อหาที่ซ้ำกันโดยมีเจตนาที่จะบิดเบือนการจัดอันดับของเราและหลอกลวงผู้ใช้ของเรา เราจะทำการปรับเปลี่ยนตามความเหมาะสมในการจัดทำดัชนีและการจัดอันดับของเว็บไซต์ที่เกี่ยวข้อง ด้วยเหตุนี้ การจัดอันดับของเว็บไซต์จึงอาจได้รับผลกระทบ หรือเว็บไซต์อาจถูกลบทั้งหมดออกจากดัชนีของ Google ซึ่งในกรณีนี้จะไม่ปรากฏในผลการค้นหาอีกต่อไป

Google อาจพิจารณาถึงเจตนาที่จะหลอกลวงผู้ใช้และ/หรือจัดการอันดับของเครื่องมือค้นหาอย่างไร การสร้างโดเมน โดเมนย่อย และเพจที่มีเนื้อหาซ้ำกันโดยเจตนา นอกจากนี้ การเผยแพร่เนื้อหาที่คัดลอกมา โดยเฉพาะอย่างยิ่งหากคุณไม่ได้เพิ่มคุณค่าอื่นใดให้กับเนื้อหานั้น

จำไว้ว่า แม้ว่า Google จะไม่ลงโทษคุณ อย่างเป็นทางการ หรือถือว่าเนื้อหาที่ซ้ำกันของคุณเป็นอันตราย แต่ก็สามารถส่งผลเสียต่อความพยายาม SEO ของคุณได้ หาก Google หยุดการจัดอันดับไซต์ของคุณเนื่องจากปัญหาเนื้อหาที่ซ้ำกัน คุณสามารถส่งคำขอให้พิจารณาใหม่เมื่อปัญหาได้รับการแก้ไขแล้ว

เนื้อหาที่ซ้ำกันเกิดขึ้นได้อย่างไร

โดยปกติ เจ้าของเว็บไซต์จะไม่ตั้งใจสร้างเนื้อหาที่ซ้ำกัน นั่นเป็นเหตุผลที่ Google ไม่ได้ลงโทษอย่างรุนแรงเกินไป นั่นคือความแตกต่างระหว่างเนื้อหาที่ คัดลอก และ เนื้อหาที่ซ้ำกัน

เนื้อหาที่คัดลอก คือเมื่อคุณใช้ถ้อยคำที่ถูกต้องจากเว็บไซต์อื่นและเผยแพร่ด้วยตนเอง เนื้อหาที่ซ้ำกัน คือเมื่อคุณมีเนื้อหาเวอร์ชันอื่นโดยบังเอิญหรือโดยไม่ได้ตั้งใจจากที่อื่นทางออนไลน์

ในที่นี้ เราจะพูดถึงวิธีการทั่วไปของเนื้อหาที่ซ้ำกันทางออนไลน์ หลังจากนั้น เราจะพูดถึงวิธีแก้ปัญหาเนื้อหาที่ซ้ำกัน

HTTP, HTTPS, WWW และหน้าที่ไม่ใช่ WWW

หากไซต์ของคุณมีสองเวอร์ชันที่แตกต่างกัน เช่น www.yoursite.com และ yoursite.com เนื้อหาเดียวกันจะอยู่ในไซต์ทั้งสองเวอร์ชัน ซึ่งหมายความว่ามีเนื้อหาที่ซ้ำกัน เช่นเดียวกับเว็บไซต์ http:// และ https://

การแบ่งหน้า

การแบ่งหน้าอาจเกิดขึ้นได้เมื่อบทความหนึ่งหรือส่วนความคิดเห็นของโพสต์ในบล็อกครอบคลุมหลายหน้า หรืออาจมีแกลเลอรีรูปภาพที่มีรูปภาพแต่ละรูปอยู่ในหน้าแยกต่างหาก การทำซ้ำประเภทนี้สามารถเกิดขึ้นได้บนหน้าเว็บที่มีการเลื่อนแบบไม่สิ้นสุด โดยที่เนื้อหาใหม่จะปรากฏขึ้นเมื่อผู้ใช้เลื่อนลงไปเรื่อยๆ

รูปแบบ URL

พารามิเตอร์ของ URL เช่น โค้ดติดตาม สามารถสร้างเนื้อหาที่ซ้ำกันโดยไม่ได้ตั้งใจ ตัวอย่างเช่น หน้าบนเว็บไซต์ของคุณอาจเป็น yoursite.com/sneakers แต่หากคุณมีโค้ดติดตามเพื่อดูว่าผู้คนคลิกผ่านมาจากที่ใด หน้านั้นจะดูเหมือน yoursite.com/newsletter?utm_source=newsletter แม้ว่า Google และเครื่องมือค้นหาอื่นๆ จะไม่พิจารณาเนื้อหาที่ซ้ำกันนี้ คุณอาจต้องจัดการกับพารามิเตอร์ที่แยกจากกันซึ่งสร้างรายการหลายรายการในแพลตฟอร์มการวิเคราะห์ของคุณด้วย

รหัสเซสชัน สามารถมีผลเช่นเดียวกัน เซสชันคือประวัติโดยย่อของสิ่งที่ผู้เยี่ยมชมทำบนเว็บไซต์ เช่น เมื่อพวกเขาเพิ่มบางอย่างลงในรถเข็นช็อปปิ้ง เซสชันจะยังคงอยู่เมื่อผู้ใช้คลิกผ่านไปยังหน้าอื่นๆ เพื่อให้รถเข็นของตนไม่เสียหาย รหัสเซสชันเป็นตัวแก้ไขเฉพาะสำหรับเซสชันนั้น และบางครั้งก็เก็บไว้ใน URL (yoursite.com?sessionId=jow8082345hnfn8456) ซึ่งสามารถสร้าง URL ที่แตกต่างกันได้หลายรายการโดยมีเนื้อหาในหน้าเดียวกัน

สิ่งเดียวกันนี้อาจเกิดขึ้นได้หากคุณมีเนื้อหา เวอร์ชันที่เหมาะกับเครื่องพิมพ์หรือเวอร์ชันที่เหมาะกับ อุปกรณ์พกพา เครื่องมือค้นหาจะคิดว่ามีหลายหน้าที่มีเนื้อหาเดียวกัน เพราะ...มี.

นี่เป็นเรื่องปกติที่เกิดขึ้นบนเว็บไซต์อีคอมเมิร์ซ โดยเฉพาะอย่างยิ่งเมื่อผู้ใช้กรองผลการค้นหา URL ยังคงเหมือนเดิม แต่มีภาคผนวกท้าย เช่น ขนาดหรือสี สิ่งนี้เรียกว่า การนำทางแบบเหลี่ยมหรือแบบกรอง เนื้อหาบนหน้าเกือบจะเหมือนกัน แต่ URL นั้นไม่ซ้ำกัน

แม้แต่เครื่องหมายส แลชต่อท้าย ก็ทำให้ URL ไม่ซ้ำกัน ตัวอย่างเช่น yoursite.com/page และ yoursite.com/page/ วิธีที่เร็วที่สุดในการตรวจสอบว่าสิ่งนี้ทำให้เกิดปัญหาเนื้อหาที่ซ้ำกันหรือไม่ ให้ไปที่หน้าทั้งสองเวอร์ชัน ถ้าโหลดไม่ได้ก็ไม่ต้องเป็นห่วง มิฉะนั้น การเปลี่ยนเส้นทางจะเป็นตัวเลือก (เพิ่มเติมในอีกสักครู่)

เนื้อหาที่ซ้ำกันเกิดขึ้นได้หลายวิธี

  • คำอธิบายผลิตภัณฑ์อีคอมเมิร์ซ: เป็นเรื่องปกติที่ไซต์อีคอมเมิร์ซต่างๆ จะมีเนื้อหาที่ซ้ำกันเมื่อใช้คำอธิบายผลิตภัณฑ์ของผู้ผลิต
  • หน้าไฟล์แนบรูปภาพ: เมื่อไฟล์แนบรูปภาพแต่ละไฟล์มีหน้าแยกกัน สามารถสร้างเนื้อหาที่ซ้ำกันได้
  • หน้าผลการค้นหา: เพิ่มพารามิเตอร์ให้กับ URL การค้นหา เช่น yoursite.com?q=search-term
  • Staging Environment: นี่เป็นเวอร์ชันที่ซ้ำกันของไซต์ของคุณที่ใช้สำหรับการทดสอบ
  • หน้าแท็กและหมวดหมู่: เมื่อคุณใช้แท็กหรือหมวดหมู่ WordPress จะสร้างหน้าแท็กและหมวดหมู่เฉพาะโดยอัตโนมัติ ซึ่งบางครั้งอาจทำให้เกิดเนื้อหาที่ซ้ำกันเมื่อหน้าหนึ่งมีหลายหมวดหมู่หรือแท็ก

วิธีแก้ไขเนื้อหาที่ซ้ำกัน

สำหรับปัญหาเล็กๆ น้อยๆ ที่ระบุไว้ข้างต้น คุณอาจพบการตั้งค่าในปลั๊กอิน SEO ที่จะช่วยได้ ตัวอย่างเช่น ในปลั๊กอิน Yoast คุณสามารถปิดใช้งาน URL ของหน้าไฟล์แนบสำหรับรูปภาพได้:

เนื้อหาที่ซ้ำกัน

WordPress ยังมีตัวเลือกในตัวสำหรับปิดการแบ่งหน้าความคิดเห็น:

เนื้อหาที่ซ้ำกัน

มิฉะนั้น แนวทางปฏิบัติต่อไปนี้เป็นวิธีหลักในการแก้ปัญหาเนื้อหาที่ซ้ำกัน

1. ค้นหาเนื้อหาที่ซ้ำกัน

ขั้นแรก คุณต้องค้นหาอินสแตนซ์ของเนื้อหาที่ซ้ำกัน เครื่องมือต่างๆ เช่น Ahrefs Site Audit และ Google Search Console สามารถรวบรวมข้อมูลไซต์ของคุณและแจ้งให้คุณทราบหากมีคำเตือนเกี่ยวกับเนื้อหาที่ซ้ำกัน

หากคุณกำลังพยายามค้นหาเนื้อหาที่ซ้ำกันบนไซต์ของคุณสำหรับคำหลักหนึ่งๆ คุณสามารถพิมพ์สิ่งนี้ลงใน Google:

site:yoursite.com intitle: คำสำคัญ

จากนั้น คุณจะเห็นหน้าทั้งหมดบนเว็บไซต์ของคุณที่มีคำหลักนั้น หลักการที่ดีคือการค้นหาคำหลักเฉพาะเพื่อให้ง่ายต่อการค้นหาผลลัพธ์

หากคุณคิดว่ามีบทความใดบทความหนึ่งที่ถูกทำซ้ำในที่อื่นทางออนไลน์ คุณสามารถใช้ตัวตรวจสอบการลอกเลียนแบบ เช่น Grammarly หรือ Copyscape เพื่อค้นหาประโยคอื่นๆ ที่ตรงทั้งหมด หรือคุณสามารถวางประโยคเต็มหรือสองประโยคลงใน Google เพื่อดูว่าประโยคนั้นปรากฏในที่อื่นที่ไม่ใช่ในเว็บไซต์ของคุณหรือไม่

2. ปรับ URL ของเนื้อหาผ่าน Canonicalization

เมื่อคุณรู้ว่ามีเนื้อหาที่ซ้ำกันทางออนไลน์ ก็ถึงเวลากำหนดว่าหน้าใดเป็นหน้าหลักที่จะเก็บไว้

คุณกำหนดหน้าหลักนั้นสำหรับเครื่องมือค้นหา Canonicalization บอกเครื่องมือค้นหาว่า URL เป็นเวอร์ชันหลักของหน้า — หน้า นี้ ควรปรากฏในผลการค้นหาแทนที่จะเป็นรายการที่ซ้ำกันที่กลไกอาจเรียกใช้ มีสองวิธีในการปรับเนื้อหาให้เป็นมาตรฐาน:

301 เปลี่ยนเส้นทาง

สร้างการเปลี่ยนเส้นทาง 301 จากหน้าที่ซ้ำกันไปยังหน้าหลัก หน้าที่ซ้ำกันจะหยุดแข่งขันกัน และหน้าหลักจะได้รับความนิยมและมีความเกี่ยวข้องมากขึ้น ซึ่งหมายความว่าจะเริ่มมีอันดับสูงขึ้น เรามีบทความเกี่ยวกับวิธีสร้างการเปลี่ยนเส้นทางด้วย WordPress เพื่อช่วยคุณ

คุณยังได้รับประโยชน์เพิ่มเติมจากลิงค์น้ำผลไม้/หน้าเพจจาก URL ที่เปลี่ยนเส้นทางซึ่งถูกโอนไปยังเป้าหมายใหม่ด้วย

Rel=”บัญญัติ” แอตทริบิวต์

คุณลักษณะนี้ช่วยให้เสิร์ชเอ็นจิ้นรู้ว่าหน้าหนึ่ง ๆ เป็นสำเนาของ URL และควรใช้ลิงก์ ตัวชี้วัด และอันดับใด ๆ กับ URL หลักที่ระบุ ไม่ใช่หน้าที่คัดลอก แอตทริบิวต์ควรรวมอยู่ในส่วนหัว HTML ของหน้าที่ซ้ำกันแต่ละหน้าที่เชื่อมโยงไปยังหน้าต้นฉบับที่คุณต้องการเน้น Google มีเอกสารที่เจาะลึกเกี่ยวกับวิธีการเพิ่มแอตทริบิวต์ และเรามีเนื้อหาที่มีรายละเอียดเพิ่มเติมเกี่ยวกับ Canonical URL และ WordPress เพื่อเสริม

เพื่อหลีกเลี่ยงไม่ให้มีการคัดลอกเนื้อหา ซึ่งเป็นเวลาที่บอทคัดลอก ดาวน์โหลด และโพสต์เนื้อหาเว็บไซต์ของคุณอีกครั้ง ให้เพิ่ม แอตทริบิวต์ rel=”canonical” ลงในหน้าเว็บของคุณเอง แอตทริบิวต์จะเป็นการอ้างอิงตัวเอง โดยจะชี้ไปที่ URL ที่เปิดใช้อยู่ แม้ว่าเนื้อหาจะถูกคัดลอก ตราบใดที่บอทพอร์ตโค้ด HTML ที่สมบูรณ์ เวอร์ชันของคุณจะยังถือว่าเป็นต้นฉบับ

3. ปรับ URL โดเมนของคุณโดยใช้ Google Search Console

Google Search Console ให้คุณกำหนดโดเมนที่ต้องการของเว็บไซต์ของคุณ เช่น yoursite.com แทน www.yoursite.com เป็นต้น คุณยังแจ้งให้ Googlebot ทราบวิธีจัดการพารามิเตอร์ URL ต่างๆ ได้อีกด้วย การดำเนินการนี้อาจช่วยแก้ปัญหาเนื้อหาที่ซ้ำกันบางส่วนหรือทั้งหมด แต่กับ Google เท่านั้น ไม่ใช่กับเครื่องมือค้นหาอื่นๆ แพลตฟอร์มเช่น Bing และ Yandex มีเครื่องมือสำหรับผู้ดูแลเว็บของตัวเอง

เคล็ดลับเพิ่มเติมในการป้องกันหรือแก้ไขเนื้อหาที่ซ้ำกัน

  1. เมื่อเพิ่มลิงก์ภายใน ให้ใช้โดเมนเวอร์ชันเดียวกัน ไม่ว่าจะมีหรือไม่มี www เป็นต้น ใช้หน้าเวอร์ชันเดียวกันเสมอโดยมีหรือไม่มีเครื่องหมายทับต่อท้าย ไม่สำคัญว่าคุณจะเลือกโครงสร้างแบบใด แต่ให้สอดคล้องกับโครงสร้างนั้น
  2. หากคุณกำลังจัดเตรียมเนื้อหาที่รวบรวมไว้ เว็บไซต์ที่ใช้เนื้อหานั้นควรเพิ่มลิงก์ย้อนกลับไปยังเนื้อหาต้นฉบับ ไม่ใช่รูปแบบของ URL แต่ URL ดั้งเดิม หลัก และตามรูปแบบบัญญัติ
  3. อย่าเผยแพร่หน้าว่างเป็นตัวยึดตำแหน่ง แต่ละหน้าที่ว่างเปล่าจะได้รับการจัดทำดัชนี ซึ่งจะทำให้เครื่องมือค้นหาคิดว่าคุณมีเนื้อหาที่ซ้ำกันจำนวนมาก
  4. ลดจำนวนเนื้อหาที่คล้ายกันที่คุณมี ตัวอย่างเช่น สมมติว่าคุณมีเว็บไซต์ด้านกฎหมายและให้บริการแก่มณฑลต่างๆ ในพื้นที่ของคุณ หน้าเฉพาะแต่ละเขตอาจมีข้อมูลที่คล้ายคลึงกัน หากคุณกำลังพูดถึงหัวข้อกฎหมายเดียวกัน เช่น กฎหมายการบาดเจ็บส่วนบุคคล ทางเลือกหนึ่งคือการรวมเพจให้ใหญ่ขึ้นเกี่ยวกับทั้งสองเคาน์ตี หรือคุณสามารถเปลี่ยนแปลงเนื้อหาให้มากขึ้นเพื่อแยกเพจออกจากกัน

ความคิดสุดท้ายเกี่ยวกับเนื้อหาที่ซ้ำกัน

การพบเนื้อหาที่ซ้ำกันจำนวนเล็กน้อยมักไม่ก่อให้เกิดความกังวล แต่ปัญหาทางเทคนิคที่ส่งผลกระทบต่อหน้าเพจนับร้อยหรือหลายพันหน้าจำเป็นต้องได้รับการจัดการ นอกจากนี้ การล้างปัญหาเนื้อหาที่ซ้ำกันทั้งหมดจะไม่เสียหาย นั่นเป็นเพียงส่วนหนึ่งของการเรียกใช้ไซต์ที่กระจายตัวและมีประสิทธิภาพสูง ท้ายที่สุด สิ่งสุดท้ายที่คุณต้องการทำคือแข่งขันกับตัวเองและทำลายอันดับของคุณเองเพราะเนื้อหาที่คุณควบคุมได้ทั้งหมด

เมื่อคุณพบเนื้อหาที่ซ้ำกันแล้ว คุณอาจต้องการอ่านบทความของเราเกี่ยวกับวิธีจัดการกับการใช้คำหลักร่วมกันเพื่อป้องกันปัญหาคำหลักที่ซ้ำกัน

คุณจัดการกับเนื้อหาที่ซ้ำกันบนไซต์ของคุณได้อย่างไร พูดคุยเกี่ยวกับกลยุทธ์ในโลกแห่งความเป็นจริงในความคิดเห็น!

บทความภาพโดย NikAndr / shutterstock.com