качество текста по закону ципфа что это

Закон Ципфа. Что это такое и как он поможет вам писать качественные тексты?

Сайтов в интернете становится все больше. На многих из них размещен уникальный, полезный и интересный контент, поэтому конкуренция за верхние позиции в Яндексе и Google постоянно растет. В связи с этим веб-мастера ищут новые (или хорошо забытые старые) способы вывода ресурса в ТОП результатов выдачи. Одна из самых интересных и в то же время противоречивых методик – анализ размещенных на сайте текстов по закону Ципфа.

Что такое закон Ципфа?

В 1908 году французский стенографист Жан-Батист Эсту разработал закономерность распределения слов, которая работает для любого естественно возникшего языка. Много лет спустя эта закономерность была популяризирована американским лингвистом Джорджем Ципфом.

Принцип закономерности прост. В каждом языке есть слова, которые встречаются чаще и реже. Знаете ли вы, что такое «уключина»? Если знаете, отлично – вы очень эрудированы. Но большинство носителей русского языка с этим словом совершенно не знакомы.

Для изучения языка нужно узнать самые употребительные слова. Их всего несколько тысяч. Затем надо обратить внимание на те слова, что употребляются реже, и только потом – на самые редкие. Суть закона Ципфа в том, что второе по частоте употребления слово будет применяться примерно вдвое реже, чем первое. Третье – в 3 раза реже, и т.д.

В поисковом продвижении этот закон используется для определения требуемой частоты ключевых слов. Таким образом, все элементы текста можно разделить на 3 группы:

Анализ по закону Ципфа помогает понять, правильно ли вы используете ключевые слова и есть ли среди них важные.

Предположим, у вас есть текст о продаже керамической плитки в Минске, в который вы вставили несколько вхождений ключевой фразы «купить плитку в Заводском районе». Анализатор проверит представленную информацию и на основании ряда параметров (длина текста, частота вхождения определенных слов и т. д.) даст рекомендации о том, какие элементы текста лучше убрать, а какие – добавить. Например, он может сообщить, что надо еще один раз использовать слово «Минск», но убрать «купить», или наоборот.

Использование закона Ципфа при написании SEO-текстов

Стоит ли оптимизатору ориентироваться на эту методику? И да, и нет. Вышеописанная техника не является идеальным рецептом по созданию высококачественных текстов. Как показывает практика, низкая оценка качества по Ципфу (меньше 50%) часто означает, что сайт спамный, а вот высокая еще ничего не значит – нужны дополнительные проверки другими методами. Если речь идет о копирайтинге, то более серьезное значение имеют иные критерии, например: семантика, интерес и полезность для пользователя, органичное употребление тематических слов.

Если вы все же хотите «подогнать» контент на своем ресурсе под закон Ципфа, учитывайте следующие рекомендации.

Словом, не надо зацикливаться на указанной системе, однако она может помочь вам проверить контент успешных конкурентов и привести свои материалы к аналогичным показателям. Успехов!

Дмитрий Буймистров.

Источник

Закон Ципфа, что это такое? Как его использовать в копирайтинге

Закон Ципфа помогает в поисковом продвижении сайтов и текстов. Сегодня рассмотрим, что это такое и как он работает в копирайтинге. Будут показаны практические примеры использования закона. С помощью полученных знаний в статье, вы улучшите свои тексты.

Закон Ципфа, что это такое? Работа закона в лингвистике

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что этоЗдравствуйте, друзья! Закон Ципфа – это распределение частоты слов естественного языка в эмпирической закономерности. Простыми словами, данный закон помогает копирайтерам и веб-мастерам создавать «живой» текст. Рассмотрим, как работает этот закон в лингвистике.

К примеру, был написан текст на 10 000 знаков. В нем встречаются частые слова, которые являются синонимами ключевого запроса. Чтобы снизить частоту повторяемых слов, используют шкалу порядка по закону Ципфа. То есть, второе повторяющийся слово будет встречаться в несколько раз реже первого, третье в 4 раза реже первого и так далее. Частота слов данного списка будут пропорциональны рангу слова.

Об истории создания этого закона вы можете почитать в Википедии.

Далее мы разберем, как работать с законом Ципфа в копирайтинге.

Ранг слова, значение на практике

Здесь будет показан ранг слова и его значение на практике по закону Ципфа. Для этого нам понадобится специальная формула – «F*R=C». Рассмотрим подробно обозначения формулы:

Рассмотренная выше формула, поможет вам выявить частые слова в вашем тексте по убыванию. Чтобы использовать формулу, достаточно подставить под значения цифры и отнести количество повторяемых слов, например, к первому и второму рангу. Об этом расскажем далее в статье.

Как работает закон Ципфа в копирайтинге

Поисковые системы научились определять естественные тексты. Если статьи генерируются с помощью программ или они заспамлены ключами – такие тексты не выводятся в топ. Поэтому, при анализе статей поисковые роботы используют эталонную частотность слов, собирают ключевые запросы и семантику со страниц. С помощью этой системы роботы оценивают по закону Ципфа текст. То есть, выявляют его естественность.

Кроме того, тошнота текстов поисковыми роботами тоже учитывается. Ведь часто употребляемые слова портят читабельность статьи. Прочитайте информацию о том, «как писать статьи на заказ». В материале узнаете о заработке на написании текстов.

Пользоваться законом Ципфа в копирайтинге просто. Проанализируйте текст на специальных сервисах и посчитайте, какое количество слов в нем повторяется. Выявить процент слов нам поможет формула, о которой говорили выше. Если процент повторяемости слов будет большим, можете улучшить текст, путем исправления (замены) слов и предложений. Но не забывайте, читабельность и смысл текста должны сохраняться.

Как использовать закон Ципфа для оптимизации текстов

Давайте используем закон Ципфа, чтобы оптимизировать какой-нибудь текст. В проверке статьи нам помогут такие сервисы: pr-cy.ru/zypfa/, seolik.ru/zipfa, progaonline.com/textquality, p2pi.ru/text-analyze.html.

Возьмем в качестве примера сервис «pr-cy.ru/zypfa/». Чтобы проверить текст на естественность, зайдите на сервис в браузере. Далее вставляете адрес страницы вашей статьи в поле и нажимаете кнопку «Анализировать» (скрин 1).

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Вы можете проверить статью из Ворда, вставив ее в раздел «Анализировать текст».

После проверки вашего материала, сервис выдаст следующие результаты (скрин 2).

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

В разделе «Вхождения», вы увидите количество встречающийся слов. Следующий раздел показывает вхождения слов по Ципфу. Далее доступны рекомендации улучшения текста.

Итак, как использовать Ципфа по формуле? Здесь нужно подставить показатели с сервиса и рассчитать число слов. Для этого пишем F=31 (количество слов), делим на 2 (ранг слова)= 15. Полученное число показывает, сколько повторов в тексте нужно убирать. Кстати, анализ на сервисе это доказывает (скрин 3).

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Стоит ли оптимизировать эту статью под Ципфу? Если процент естественности текста меньше 50%, то да. Максимальный процент живого текста равен 50% и больше. Для того, чтобы подогнать статью под закон, необходимо убрать похожие по смыслу слова. Вы можете воспользоваться нашим курсом: «Честные деньги«. Он поможет на практике обучиться написанию статей и заработать через Интернет.

С кем не работают оптимизаторы и почему

Оптимизаторы не работают с теми авторами, которые не умеют качественно обрабатывать материал. Такой контент не принесет веб-мастерам пользы – не будет трафика и заработка.

Поэтому, важно научиться писать статьи для людей. О том, как это сделать, рассказано в моей книге: «Как написать статью». С помощью книги вы научитесь не только писать грамотно статьи, но и оптимизировать их под поисковые запросы.

Заключение

Итак, закон Ципфа, точнее, его соблюдение, влияет на продвижения сайтов и блогов в Интернете через качество написанных статей. В статье мы выяснили, что это за закон, как с его помощью оптимизировать тексты. Пишите статьи грамотно, делайте их для людей и не забывайте про поисковое продвижение.

Источник

Копирайтинг путь к успеху

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Увеличиваем естественность текста по закону Ципфа

Всем привет! В последнее время все чаще от коллег слышу о требовании в ТЗ оценивать качество текста по закону Ципфа. И далеко не все понимают, как нужно редактировать текст под этот закон. В сегодняшней статье попробую рассказать, как наиболее простым способом улучшить параметр, а также уточню почему хорошим авторам на самом деле это не нужно.

Определить качество текста по закону Ципфа можно по нескольким сервисам. Но, наиболее адекватным я считаю PR-CY, тут сочетается правильная формула с простым и понятным интерфейсом. Именно его я и использовал при подготовке этого материала.

Что такое закон Ципфа

Для начала стоит разобраться, что это такое. Если верить Википедии, сформулировал эту закономерность в 1908 году Жан-Батист Эсту, первоначально относился этот закон к стенографии. Первое известное широкой общественности применение закономерности относится к демографии, а точнее к распределению численности населения в городах, использовал ее Феликс Ауэрбах.

Современное название закономерность получила в 1949 году благодаря лингвисту Джорджу Ципфу. Он показал с ее помощью градацию распределения богатства среди населения. И только потом закон стали применять для определения читабельности текстов.

Как рассчитывается

Чтобы правильно использовать этот закон нужно понимать, как он работает. Разберем формулу для расчета.

На практике более удобной оказывается другая формула, она выглядит понятнее.

Удобнее такой подход так как у нас есть данные по числу повтора максимально распространенного слова. Именно от этого количества и отталкиваются.

Если упростить, то в нашем тексте второе по повторяемости слово должно встречаться в два раза реже, чем первое. Идущее на третьем месте, в три раза и так далее.

Пример подгонки текста

С теорией немного разобрались. Осталось разобраться с практикой. В качестве подопытного текста взял статью из Т-Ж. Почему именно оттуда? Все просто. На текущий момент это один из лучших образчиков любимого многими инфостиля. Ну, и было интересно, что покажет текст, написанный под руководством Максима Ильяхова. Скажу сразу, тексты по этому показателю на уровне, хотя, перелопатив более 40 сайтов вообще не нашел ни одной статьи с плохой естественностью. Также, сразу забегу вперед и скажу, что подопытный текст после подгонки стал намного хуже, несмотря на улучшенный показатель по Ципфа, не стоит сильно заморачиваться по чрезмерному повышению естественности.

Вот что нам показал анализатор после проверки.

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Разберем, что там указано. Как видим есть столбец со словами, а также непонятные цифры. В столбце «вхождения» (1) указано сколько раз встречаются словоформы в тексте. В столбце «по Ципфу» (2) рекомендованное количество вхождений. Маркерами 3 и 4 помечены идеальные показатели для второй и третьей позиции. Также стоит обратить внимание на рекомендации, здесь указано сколько слов нужно убрать для достижения идеального сочетания.

Для большего понимания разберем, что насчитал анализатор. За основу возьмем цифру 39 (C), также нам понадобится порядковый номер, обратим внимание на 2 (F) позицию. Берем формулу.

F=39/2=19,5

Округляем в большую сторону и получаем 20, это и будет необходимым количеством вхождений. Что подтверждает и анализатор. У нас же второе по популярности слово употребляется 28 раз, соответственно 8 повторов нужно будет удалить или заменить.

Разобравшись с принципом работы закона начинаем редактировать. Для этого удаляем или заменяем на синонимы слова, у которых больше вхождений, чем это требуется по Ципфа. В результате получаем вот такую картину.
качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Как видите, мне удалось увеличить показатель с 83% до 88%. Но, при этом значительно пострадало качество текста. Не стоит стремиться к увеличению этого показателя до 100%. По факту, если у вас уже есть 75%, это отлично и дальше извращаться не стоит.

Уделяйте внимание не только первым строчкам. Начинайте подгонку с последних позиций в списке, они зачастую оказывают большее влияние на общий показатель, чем первый десяток слов.

Ципфа и SEO

Теперь перейдем к тому, зачем требуется знание этой закономерности копирайтеру. Сеошники заказывая тексты стремятся сделать их наиболее удобными для поисковых систем. Считается (правда, непонятно кем), что закон Ципфа активно используется поисковыми алгоритмами. Доказать или опровергнуть это утверждение сложно. Никаких вменяемых исследований и экспериментов на эту тему мне найти не удалось.

Решил проверить самостоятельно. Для этого взял выдачу по такому конкурентному запросу «пластиковые окна», в Яндексе бралась московская выдача, в Гугле пришлось поколдовать, и он меня вроде тоже определил, как жителя столицы (по крайней мере рекламу мне показал с московской геолокацией). Брал первую страницу выдачи, плюс 49 место. Получилась вот такая табличка.качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Если посмотреть внимательнее, можно обратить внимание, в Яндексе выдача более ровная, если смотреть на исследуемую нами закономерность. Но, при этом более высокий показатель не гарантирует победы в борьбе за первое место в топе.

На основании этого можно сказать, если поисковики и применяют данный закон, является он только одним из факторов. И не основным.

Выводы

Ну, вот и все. Теперь вы знаете, что такое качество текста по закону Ципфа, а также можете корректировать этот показатель. На самом деле тут нет ничего сложного, все достаточно просто. Достаточно один раз понять принцип работы этой закономерности.

10 thoughts on “ Увеличиваем естественность текста по закону Ципфа ”

Спасибо за статью, интересно было ознакомиться! Только у меня скриншоты проверки почти не увеличиваются, сложно разобрать, что там написано, даже цифры (((
И тут это… заинтриговали проверкой текста МИ, а насколько изменилось абстрактное качество – непонятно… Хотелось бы пример, хоть огрызочек какой-нибудь…

Скрины поправил, но видимо из-за всех манипуляций все равно немного мутно получилось. Выкладывать кусочки не буду, ибо у меня нет договоренности с Максом на такое использование его текстов. Могу привести пример, мне пришлось убрать практически все упоминания о коллекторах, в итоге из текста понятно, что проблемы возникают с какими-то людьми, но непонятно кто они.

Привет, спасибо очень интересная статья. Только тоже не видно скриншотов (((

О, а я, оказывается, с этим сталкивалась. Только ни про какой закон не указывалось, просто во время проверки рекомендовали снизить или увеличить количество определенных слов :))))

Это сейчас частая фишка.

расскажу вам секрет, как сеошник. Берете сервис Миратекст семантический анализ и меняете текст, пока облако тегов не покажет ключи жирными и ципфа от 55% и выше) Это хорошо.

Если судить по Miratex у этого текста всего 40% качества по закону Ципфа

Миратекстом никогда не пользовался. Да и большой отклик читателей говорит, что с текстом все нормально.

Вы попали в самую точку. Мне кажется это хорошая мысль. Я согласен с Вами.

Добавить комментарий Отменить ответ

Этот сайт использует Akismet для борьбы со спамом. Узнайте как обрабатываются ваши данные комментариев.

Источник

Как поисковые системы используют семантический анализ текста для оценки релевантности

Несмотря на свою востребованность практически во всех областях жизни человека, семантический анализ является одной из сложнейших математических задач. Вся сложность заключается в том, чтобы «научить» компьютер правильно трактовать образы, которые пытается передать автор текста.

В этой статье мы разберем, как поисковые системы извлекают из запроса его семантическое значение, метод TF-IDF и закон Ципфа. В первой части статьи вы можете узнать про основной способ обработки языка Bag-of-words, как поисковая система понимает отдельные слова и предложения и находит соответствующий документ. Читайте и становитесь настоящим гуру поисковой оптимизации.

TF-IDF и закон Ципфа

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Самые популярные слова будут отображаться в большинстве документов. В результате такие слова усложняют подбор текстов, представленных с помощью модели мешка слов. Кроме того, самые популярные слова часто являются функциональными словами без смыслового значения. Они не несут в себе смысл текста.

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

В таблице ниже приведены значения IDF для некоторых слов в пьесах Шекспира, начиная от самых информативных слов, которые встречаются только в одной пьесе (например, «Ромео»), до тех, которые настолько распространены, что они полностью не дискриминационные, поскольку встречаются во всех 37 пьесах. Такие как «хороший» или «сладкий».
IDF самых распространенных слов равен 0, в результате их частоты в модели мешка слов также будут равны 0. Частоты редких слов будут наоборот увеличены.

DFIDFРомео

210,074дурачить

Что нужно знать SEO-специалисту

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Семантические слова

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Вы же сразу поняли, о каком фильме идет речь? Как мы видим, поисковая система отлично справилась с задачей. Несмотря на то, что в нашем запросе нет слов ирония / судьба / с легким паром в выдаче мы видим “Иронию судьбы”.

Но как поисковая система может понять значение слова или смысл поискового запроса? Или как мы должны указать значение слова, чтобы компьютерная программа могла понять и практически использовать его в выдаче документов?
Ключевой концепцией, которая помогает ответить на эти вопросы, является дистрибутивный анализ. Она была впервые сформулирована еще в 1950-х годах. Лингвисты заметили, что слова с похожим значением имеют тенденцию встречаться в одной и той же среде (то есть рядом с одними и теми же словами), причем количество различий в значении между двумя словами примерно соответствует разнице в их LSI-фразе.

Вот простой пример. Допустим, вы сталкиваетесь со следующими предложениями, при этом не зная, что такое лангустин :

Также вы определенно сталкиваетесь со следующим, так как большинство читателей знают, что такое креветка:

Тот факт, что лангустин встречается с такими словами, как деликатес, мясо и макароны, может указывать на то, что он является своего рода съедобным ракообразным, в чем-то похожим на креветок. Таким образом, можно определить слово по среде, в которой оно встречается и по множеству контекстов.

Как мы можем преобразовать эти наблюдения в нечто значимое для компьютерной программы? Можно построить модель, похожую на мешок слов. Однако вместо документов мы обозначим столбцы с помощью слов. Достаточно распространено использование небольших фраз в контексте целевого слова, но не более четырех слов. В этом случае каждая ячейка в модели обозначает количество, сколько раз слово встречается в контекстной фразе (например, плюс-минус четыре слова). Давайте рассмотрим эти контекстные фразы. В таблице ниже пример из книги Даниэля Джурафски и Джеймса Мартина «Обработка речи и языка».

Ключевое словоКонтекстсахар, нарезанный лимон, столовая ложка

абрикосваренье, щепотка каждого изих удовольствие. Она осторожно взяла пробу

ананаси другой фрукт, вкус которого она сравнилахорошо подходит для программирования на цифровом

компьютерВ поиске оптимальной R-стадии политики изс целью сбора данных и

информациянеобходимо для исследования, разрешенного в

Для каждого слова в соседних колонках мы указываем тематические слова из текста, где оно используется. В результате получаем матрицу совпадения слов. Обратите внимание, что «цифровые» и «информационные» контекстные слова больше похожи друг на друга, чем на «абрикосовые». Количество слов может быть заменено другими показателями. Например, показатель взаимной информации.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

трубкозуб.компьютерданныезажиматьрезультатсахар.
абрикос

0.00101.
ананас

0.00101.
цифровой

0.21010.
информация

Каждое слово и его семантическое значение представлены вектором. Семантические свойства каждого слова определяются его соседями, то есть типичными контекстами, в которых оно встречается. Такая модель может легко уловить синонимию и родственность слов. Векторы двух одинаковых слов будут проходить рядом. Векторы слов, которые появляются в одном и том же тематическом поле, будут образовывать кластеры.

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

В семантическом поиске нет магии. Концептуальное различие заключается в том, что слова представляются в виде векторных вложений, а не лексических элементов.

качество текста по закону ципфа что это. Смотреть фото качество текста по закону ципфа что это. Смотреть картинку качество текста по закону ципфа что это. Картинка про качество текста по закону ципфа что это. Фото качество текста по закону ципфа что это

Что нужно знать SEO-специалисту

Вопросы, предложения и критика приветствуются в комментариях.

Еще больше интересных фактов про SEO читайте в VK или FB.

Источник

Где применяется закон Ципфа Зипфа?

Приятно похвастаться, что и мои публикации по лингвистике нужны именно профессионалам.

Поэтому не под, а над текстом помещаю список полезных ссылок, рекомендованный в интересной мне статье, встреченой мною сегодня в интернете.
Там упомянута (выделенная здесь мною) и моя публикация о применении закона Зипфа.
Иосиф Ольшаницкий.

October 13th, 8:51
Статья опубликована на сайте Школа жизни

Частотный словарь русского языка
Частотные словари английского языка
Закон Ципфа. Условная энтропия. Свойства иерархической аддитивности
Законы царства документов
Фрактальная модель информационного пространства
Закон Ципфа и фрактальная природа социальных и экономических явлений
Закон Ципфа – вводная
Интерпретация текста музыки
Эрец Эйден Жан-Батист Мишель. Неизведанная территория [Как «большие данные» помогают раскрывать тайны прошлого и предсказывать будущее нашей культуры]
Бенуа Мандельброт
Национальный корпус русского языка
.
Закон Зипфа в случайных текстах.

Tags: закон Зипфа, школа жизни

ГДЕ ПРИМЕНЯЕТСЯ ЗАКОН ЗИПФА?

Открытие закона Ципфа стало началом инфометрии, науки об измерении количественных характеристик информации. Эта наука сейчас очень востребована. На ее основе работают алгоритмы поисковых систем вроде Google и Yandex, определяющие популярность сайтов и степень их соответствие поисковому запросу.

Главная задача хозяев Интернет-сайта состоит в том, чтобы продвинуть свой сайт в число самых первых по соответствию какой-нибудь поисковой фразе. В своей борьбе за первые места в топе некоторые из этих ребят не брезгуют откровенным жульничеством. Например, относительно недавно был в ходу такой прием: вставлять в текст сайта желаемую поисковую фразу везде, где можно. И где нельзя, тоже, маскируя это безобразие нечитаемым шрифтом. Например, писали поисковую фразу белыми буквами по белому фону или употребляли очень мелкий шрифт. Зачем? Затем, чтобы доказать поисковым системам, что их сайт лучше других соответствует данному поисковому запросу. Чем чаще встречается поисковый запрос на их странице, тем лучше. Вероятно, жулики считали, что кашу маслом не испортишь.

Но современные поисковые системы эту хитрость легко обнаруживают и обезвреживают. И помогает им в этом закон Ципфа.

Естественно, что закон Ципфа должен соблюдаться и для всего языка и для некоторого его подмножества, небольшого текста, находящегося на сайте. Поисковым системам не сложно определить частоту встречаемости слов на проверяемом сайте. При этом частота слов, «накручиваемых» с помощью недобросовестных приемов, будет значительно превышать значения частот, какие соответствовали бы закону Ципфа. Таким образом, обман довольно легко обнаруживается, и сайты, создатели которых хотели обмануть поисковые системы, этими системами вообще блокируются.

В языкознании, как в любой науке, вопросов больше, чем ответов. Распределение слов по частотам только констатирует уже сложившееся в языке положение: одни слова встречаются чаще, чем другие. С помощью закона Ципфа можно определить некоторые количественные зависимости в частоте встречаемости слов.

Но можно ли ответить на вопрос, почему одни слова становятся более популярными, чем другие? Примеров того, как одни слова вдруг начинают употребляться чаще, чем другие, и очень быстро занимают высокие места в частотных словарях, мы знаем множество. Один из самых головокружительных взлетов претерпело английское слово yahoo. До 1994 года это слово встречалось, пожалуй, только в одной книге, в «Путешествиях Гулливера» Дж.Свифта. В третьем своем путешествии капитан Гулливер попадает в страну, где люди – дикие и неразумные существа, которых называют yahoo (в русском переводе «йеху»). В 1994 году образовалась
компания Yahoo!, занимавшаяся бизнесом в сфере Интернета. Параллельно росту и коммерческим успехам этой компании слово yahoo становилось все более популярным и, главное, поменяло свой смысл. Теперь, произнося это слово, мы только в последнюю очередь вспомним о первоисточнике, английской книге 17-го столетия.

Оказывается, закон Ципфа позволяет дать, хотя бы качественно, ответ на вопрос о том, как происходит рост популярности тех или иных слов.

В начале графика
В «хвосте» графика

Если не слишком вдаваться в математические тонкости, то объяснение будет таким.

Однако эта дальняя область примечательна тем, что слово, находящееся здесь, может очень легко многократно уменьшить значение своего ранга. Даже самое маленькое увеличение частоты встречаемости слова резко сдвигает его положение к началу частотного словаря. Например, начинающий артист будет рад упоминанию своего имени даже

В терминах этого закона мерой популярности слова является его положение в частотном словаре языка. Более популярное слово находится ближе к началу словаря, чем менее популярное.

Сам закон Ципфа отражает зависимость частоты использования слова в языке от его места в частотном словаре. Популярные слова языка употребляются чаще. С математической точки зрения график этой зависимости является гиперболой с резким подъемом по мере приближения к началу координат и длинным, пологим, почти горизонтальным, «хвостом». БОльшая часть слов языка размещается именно в этом «хвосте». Здесь место слова в частотном словаре, если и изменяет частоту использования этого слова в языке, то совсем не на много.

Обратный процесс тоже имеет место. Совсем небольшое изменение частоты встречаемости слова в языке может сильно сдвинуть это слово в частотном словаре к началу, то есть значительно повысить его популярность. Еще одно небольшое изменение частоты встречаемости слова – снова большое повышение популярности. Причем в начале рост популярности слова не требует значительных усилий. Все происходит как бы само собой. Слово, о котором много говорят, без видимых усилий становится все более популярным.

Но как только положение слова в частотном словаре достигает того места на гиперболе закона Ципфа, где по мере приближения к началу координат начинается существенный подъем кривой, ситуация изменяется. Теперь небольшое изменение частоты встречаемости слова уже не приводит к значительным изменениям его ранга, то есть положение слова в частотном словаре перестает изменяться. Значит, рост популярности слова затормозился. Для того, чтобы он продолжался, следует предпринять специальные меры для того, чтобы повысить частоту встречаемости слова. Например, если слово – название товара, необходимо потратить средства на рекламную компанию. Если это – имя киноактера, этот актер должен сняться в каком-нибудь блокбастере или совершить некий экстравагантный поступок, чтобы о нем снова заговорили. И не просто заговорили, а заговорили гораздо громче, чем прежде. Только тогда он сможет сдвинуться вверх в рейтинге себе подобных. Но это перемещение будет достигаться, чем дальше, тем с большим трудом. И, наконец, остановится. Дальнейшие затраты на рекламу в целях повышения популярности имени станут неэффективными. Более того, излишняя реклама может привести к результатам, противоположным ожидаемым. Так, слишком назойливая реклама консервов «Ветчина со специями», SPAM («SPiced hAM») привела к тому, что эту торговую марку в 1969 году осмеяли в телевизионном скетче комик-группы «Монти Пайтон». А потом эта торговая марка превратилась в имя нарицательное, обозначающее любую назойливую и неуместную рекламу. Это – самое худшее, что может произойти с торговой маркой. Впрочем, для актеров и для политиков тоже небольшая радость, когда их имя превращается в нарицательное. Может статься, что, в конце концов, имя Ю.В.Андропова станет ассоциироваться только с дешевой водкой, «андроповкой», выпущенной во время его недлинного правления Советским Союзом.

Как видим, закон Ципфа, казалось бы, академический и абстрактный, может помочь нам понять некоторые очень конкретные процессы, происходящие в окружающем нас мире, который все более и более становится миром информационным.

Статья опубликована на сайте Школа жизни

Источник