Наказание за дублированный контент - просто призрак сео ?!

  1. С или без www?
  2. Повторяющийся контент на вашем собственном домене
  3. Много повторяющихся отрывков текста
  4. Дублированный контент на разных доменах
  5. Описание продукта из каналов
  6. Но что, если тексты украдены?
  7. кавычки
  8. Фиды данных / агрегаторы
  9. Вывод: нет штрафов за дублирование контента!

22 апреля 2013 г. 22 апреля 2013 г

Дублированный контент - штраф ???

Я хочу один здесь в блоге интересное гугл + обсуждение подобрать по конкретному вопросу. Это про "дублированный контент". Этот термин, который часто используется в контексте SEO, неоднократно вызывает путаницу. Дублированный контент - это буквальные отрывки слов. Он в основном используется в контексте копий веб-страниц, но иногда он также применяется к абзацам или фрагментам текста, которые появляются на многих страницах. Приводит ли дублирование контента к штрафу? И если да, то когда? Это проблема, если вы забыли указать, отображается ли домен с или без "www."?

Для пояснения следует помнить, что в основном есть две области:

  1. Повторяющийся контент на вашем собственном домене
  2. Дублированный контент на разных доменах

С или без www?

Я много раз читал, что ничего не подозревающие новички на форумах были напуганы тем, что в их домене возникла « серьезная проблема с DC », потому что нет перенаправления с или без www. Но: я уже реализовал много проектов и уже забыл эту диверсию. Это никогда не больно. Эта форма дублированного контента не приводит к наказанию. Джон Мюллер из Google уже подтвердил несколько раз. В этом случае Google просто смотрит, какой адрес более актуален, и игнорирует другую версию.

Следующее видео описывает интересный особый случай, который также имеет отношение к контенту на немецком языке (D - A- Ch):

Опять же, Мэтт говорит: пока нет доказательств спама, эта форма дублированного контента для конкретной страны не представляет проблемы.

Также интересно в этом контексте: является ли мобильная версия домена дублированным контентом? Конечно нет, смотрите:

Повторяющийся контент на вашем собственном домене

Другие примеры непреднамеренно создаваемого массового дублированного контента часто можно найти в блогах и магазинах. Если вы настроили блог так, чтобы статьи полностью отображались на главной странице, он дублируется. Упомянутая выше ветка Google + была посвящена фиду данных, который также дублировал статьи. Также возможно, что «теги» используются для создания многочисленных подстраниц, которые также имеют идентичное содержимое. Как насчет всех этих случаев внутреннего дублированного контента? Вы должны бояться ухудшения рейтинга?

Опять же, то, что сказал Джон, согласуется с моим опытом: это не проблема. Google признает, что они являются копиями, и пытается найти наиболее релевантную страницу. Он не должен отображаться 17 раз одинакового содержания в результатах поиска, но только один раз.

Это становится трудно только с очень большими сайтами. Конечно, использование дублированного контента в миллионах потребляет ненужные ресурсы сканера. Поэтому Google говорит, что вы должны быть осторожны, чтобы не создавать дублирующийся контент. Google может затем попытаться удалить дубликаты страниц из индекса - и это может привести к нежелательным последствиям.

Чтобы исключить это дублирование в собственном домене, нужно разобраться с темами «canonical», «noindex» и «nofollow» или robots.txt. Это привело бы слишком далеко здесь.

Много повторяющихся отрывков текста

Это также относится к отрывкам, которые повторяются на многих страницах. В этом случае эти отрывки, вероятно, будут игнорироваться. Пример: в картинной галерее под каждой картинкой есть абзац об авторских правах и условиях использования. Это не ведет к наказанию. Но - независимо от предмета DC: по моему опыту, нужно быть осторожным с такими отрывками, чтобы не смачивать содержание страницы. Это может привести к ухудшению рейтинга, но это не имеет ничего общего с DC, кроме релевантности ключевого слова.

Дублированный контент на разных доменах

В дополнение к внутреннему дублированному контенту страницы, есть также текстовые копии на других сайтах. Причиной может быть как наглый коготь, так и нормальное распространение. Например, пресс-релизы часто распространяются в Интернете в количестве от 1 до 1 экземпляра. Но мы все знаем, что преимущества пресс-релиза всегда положительны. Также в этом случае: DC не повредит. Но: Google всегда пытается выяснить, откуда изначально появился пресс-релиз, чтобы затем связать эту страницу с результатами поиска. Поэтому тот, кто публикует пресс-релиз: всегда публикует сначала на своем домене и ждет, пока гусеничный проиндексировать их, прежде чем сделать их общедоступными для распространения. И в пресс-релизе проверьте свой собственный URL в качестве источника. Невероятно, как часто это забывают.

Описание продукта из каналов

Кому принадлежит магазин, нужны описания товаров. С тысячами продуктов приходит много усилий вместе. Поставщики продуктов часто предоставляют эти описания в качестве канала. Так что может быть лучше, чем использовать эти тексты? Но именно здесь возникает проблема с дублированным контентом: один и тот же текст используется так быстро на сотнях или тысячах страниц. Вот видео от Мэтта Каттса:

Опять же, проблема в массе собственного контента.

Но что, если тексты украдены?

Также в этом случае это не приводит к штрафу. Опять же, Google пытается выяснить, кто является первоисточником. Подготовка к новым доменам может быть проблемой, поскольку такие вещи, как доверие и видимость, могут иметь значение. И если более авторитетная страница украдет контент, она, вероятно, получит ссылку от Google. И с таким украденным текстом домен воров даже укрепил бы свою репутацию в среднесрочной перспективе. Поэтому настоятельно рекомендуется действовать против такого содержания воров. Не только по моральным и юридическим причинам, но и потому, что с точки зрения seo, другая сторона выиграет от своей собственной деятельности.

кавычки

В связи с этим возникает вопрос: а как же цитаты? Потому что это, с точки зрения Google, конечно, округ Колумбия. Конечно, цитата никогда не может быть полным текстом, но в любом случае может быть только отрывком в более широком контексте, в котором независимая мысль является темой, которая поддерживается только цитатой. Вот сравнительно недавнее видео Мэтта Каттса о:

Фиды данных / агрегаторы

«Цитировать особый случай» - это фид данных: здесь контент из других источников автоматически сопоставляется. Если страница состоит только из списка собранного контента, это может привести к штрафу не из-за постоянного тока, а из-за «тонкого контента», потому что просто нет собственного контента. Вот видео о:

Вывод: нет штрафов за дублирование контента!

Джон Мюллер ясно дал понять: штраф за дублирование контента отсутствует. Вам не нужно беспокоиться о теме. Если у вас есть время, чтобы очистить DC на своих страницах: хорошо. Но более важным является создание нового и хорошего контента. Есть только две вещи, которые могут быть проблематичными с Duplictae Content:

  • Большие сайты могут уступить гусеничной способности.
  • Если вы отфильтровываете дублированный контент, многие сайты просто имеют немного собственного контента. Дэн имеет тонкий контент. Итак, проблема панды.

Итак, теперь мне любопытно, какие наблюдения вы сделали на DC.

Итак, теперь мне любопытно, какие наблюдения вы сделали на DC

Дублированный контент-призрак

более

С или без www?
Дублированный контент - штраф ?
Приводит ли дублирование контента к штрафу?
И если да, то когда?
Также интересно в этом контексте: является ли мобильная версия домена дублированным контентом?
Как насчет всех этих случаев внутреннего дублированного контента?
Вы должны бояться ухудшения рейтинга?
Так что может быть лучше, чем использовать эти тексты?
Но что, если тексты украдены?