Перейти к содержанию

Анализ часто используемых статей

Одним из основных направлений является анализ повторного использования статей. Анализ частоты повторного использования статей за определенный период времени покажет наиболее ценные статьи, заслуживающие нашего внимания.

Этот метод называется анализом Парето. Это частотное распределение количества ссылок на статью.

Распределение частоты повторного использования статей в домене всегда представляет собой кривую распределения по правилу 80-20. Практически в каждой организации, с которой мы имели возможность работать над анализом повторного использования статей, 80% статей редко или никогда не используются повторно (длинный хвост). Из оставшихся 20% одни используются повторно гораздо чаще, чем другие.

Несколько вопросов, которые нужно задать себе по поводу статей в в верхней части кривой распределения:

  • Являются ли эти часто используемые статьи правильными и точными?
  • Соответствуют ли эти статьи нашему контент стандарту?
  • Есть ли в длинном хвосте статьи, посвященные тем же или похожим вопросам, что и в начале кривой?
  • Какие проблемы являются кандидатами на анализ первопричин для устранения их в продукте?

После того, как мы определили наиболее часто повторно используемые статьи в одной предметной области, следующим шагом будет посмотреть возможные похожие кластеры в других областях.