17 абсолютно разных историй
Мы часто пишем о сложных, технических вещах в мире SEO, но сегодня мы решили немного разнообразить наш блог и рассказать как применяется прогнозная аналитика в повседневной жизни.
В SEO прогнозная аналитика - практически идеальный инструмент, поскольку мы можем получить бесконечное количество данных и на их опыте делать качественные прогнозы. Но главный плюс прогнозной аналитики заключается в том, что предсказать можно все, а не только SEO события.

Иванов Дмитрий
Генеральный директор
ЧТО ЖЕ ТАКОЕ ПРОГНОЗНАЯ АНАЛИТИКА В ЖИЗНИ?

Прогнозная аналитика

Класс методов анализа данных, концентрирующийся на прогнозировании будущего поведения объектов и субъектов с целью принятия оптимальных решений.
На западе прогнозная аналитика применяется повсеместно, там ко всем делам подходят с точки зрения автоматизации и интеграции в текущие бизнес процессы.
В России в этом направлении всё намного сложнее, банковская отрасль делает неплохой скоринг, на этом всё и заканчивается.
Истории о?
Разделим наши истории на тематики
  • Потребление
    Как учавствует при достижения поставленных целей и задач
  • Любовь, работа, разводы
    Как прогнозируются одни из главных сторон в вашей жизни
  • Мышление
    Как помогает в процессе познания окружающего мира
  • Уход сотрудников и клиентов
    Как узнать о потерях, до самого факта
  • Болезни и смерть
    Как спрогнозировать то, чего не избежать
  • Ложь и мошенничество
    Как выявить то, что не соответствует действительности
итак, истории в студию!
Потребление
Американская компания Netflix готова была заплатить 1 миллион долларов группе учёных, которым удастся улучшить сервис рекомендаций фильмов для пользователей. Был объявлен конкурс на разработку алгоритма, который повысит точность рекомендаций на 10%. На тот момент сервис мог с вероятностью 60% предлагать пользователями фильмы, которые им понравятся на самом деле. Данные собирались на основе оценок, которые поставил пользователь другим фильмам. Потребовалось всего 2 дня, чтобы повысить качество сервиса на 8%, с последними 2% команды бились около 8 месяцев, в итоге объединили свои силы и разбились на две группы. Драма этой истории в том, что одна команда принесла результат в 70% на 2 часа раньше, чем другая.

На западе прогнозная аналитика широко используется уже почти всеми от гигантов банковского дела, таких как US Bank, до небольших производителей сладостей. Одна из самых популярных целей прогнозной аналитики — увеличение продаж: с помощью прогнозирования найти клиента, который действительно будет покупать продукцию и направить на него свои маркетинговые активности. Подобные прогнозы делаются, основываясь на поведении пользователей на сайте: какие покупки были совершены, какие страницы просматривались несколько раз, при условии, если на сайте была заполнена анкета или регистрация была совершена через социальную сеть, то абсолютно вся информация, которая есть на странице парсится, затем на основе всех данных делаются прогнозы.

Аналитики из Wall Street прогнозируют цены акций наблюдая их движение под влиянием динамики спроса, а компания Alphagenius управляет торговыми операциями своих хедж-фондов, отслеживая тренды настроения широкой общественности через посты в твиттер. Ежедневно 50 миллионов людей пользуются твиттером и пишут о том, что происходит в их жизни. Таким образом, парсятся миллионы/миллиарды строк данных из твиттера, твитты группируются на популярные, сверхпопулярные и прочие, внутри всех постов выделяется текстовое построение или тестовый маркер. После анализа твиттов складывается общее настроение пользователей в разных областях Земли: негативное или положительное. На основе этих данных была замечена корреляция того, что после 11 сентября, когда общественность реагировала отрицательно, наблюдался спад цен. Таким образом, компания могла с большей долей вероятности спрогнозировать, куда будут расти цены на акции.

Любовь, работа, разводы
интересно, интересно
Ведущая социальная сеть для делового общения LinkedIn прогнозирует профессиональные навыки пользователей. Если в графе должность пользователь вводит, например, SEO специалист или упоминает, что занимается изучением Google Analytics. LinkedIn прогнозирует через какое время этот пользователь станет руководителем SEO отдела или сертифицированным специалистом по Google Analytics.
Популярные сайты интернет-знакомств Match.com, Сupid, Еharmony могут спрогнозировать кто подходит вам больше всего и на самом деле станет вашей второй половинкой. Данные собираются, основываясь на переписке, сообщениях, которые пишут другие пользователи, учитываются взгляды, вкусы, интересы и истории реальных отношений, которые сложились благодаря сайту знакомств.

Клинические исследователи прогнозируют на сколько крепким будет брак, прогнозируют потенциальные измены и возможность разводов. Сервис Divorce 360, благодаря которому пользователи самостоятельно могут оценить свои шансы на долгие и прочные отношения. Чтобы получить наиболее точный и качественный прогноз необходимо внести как можно больше данных.
Мышление
В 2012 году Барак Обама был переизбран в президенты именно благодаря прогнозированию поведения избирателей. Задача предвыборной кампании состояла в том, чтобы найти аудиторию, которая ещё не уверена в своём решении, а факты, которые помогли бы этой аудитории сделать выбор, отсутствуют. На основе Больших Данных была отобрана та самая группа неопределившихся людей. После чего через социальные сети и e-mail рассылку эта часть избирателей получила материалы, где Мишель Обама встречается с фермерами, учениками школ и с обычными жителями в супермаркетах. Этим сообщением предвыборная кампания донесла до аудитории, что Барак Обама — это тот самый Президент Америки, вне зависимости от цвета кожи и социального статуса. Тот факт, почему была выбрана супруга, а не сам Барак Обама, работа сложных аналитических подсчётов, по прогнозам реакция избирателей на Мишель Обаму должна была быть наиболее лояльной и в этом машина не ошиблась, в 2012 году Барак Обама был переизбран в президенты США.

Разработанные компьютерные программы для автоматической оценки школьных сочинений, также работают на основе прогнозирования и оценивают сочинения так, как бы это сделал преподаватель. Проверенные схемы и алгоритмы оценки существуют уже в большинстве школ. Огромная база данных содержит в себе все сочинения, написанные за последние 20 лет. Как показывает статистика, все студенты и школьники пишут сочинения почти идентичные друг другу. Единственное чем они могут отличаться — это небольшое количество слов, которые с легкостью можно определить, затем составить частотный список слов, после начинать проверку на наличие пунктуационных, грамматических и других ошибок.

Компьютер Watson, созданный компанией IBM, несколько лет назад принял участие в викторине Джеопарди. Машина, основываясь на огромном количестве данных из выгрузки из википедии, данных ответов за последние 10 лет игры, смогла ответить на заданные в свободной форме вопросы, опираясь на технологию прогнозирования. Таким образом, компьютер переиграл двух лучших игроков за всю историю игры. Более того, компьютер смог пройти тест Тьюринга, после чего IBM заявило, что создан искусственный интеллект. На этом закончилась карьера компьютера Watson в викторине и ему стали доверять жизни людей, теперь он работает в медицине.
Уход сотрудников и клиентов

Компания Hewlett-Packard оценивает риски ухода своих сотрудников, которых более 333 000 по всему миру. Данный алгоритм помогает менеджерам заранее найти замену человеку, который планирует покинуть свою должность в компании. Система почти с 80% точностью могла вычислить имена тех, кто планирует уйти, но иногда человек ещё сам не знал об этом, а машина уже решила его судьбу на ближайшие пол года.

Американская компания FedEx, предоставляющая почтовые, курьерские и другие услуги логистики по всему миру с точностью до 60% может предсказать какие клиенты могут уйти к конкурентам.

Wikipedia прогнозирует, кто из её редакторов, работающий бесплатно ради развития этого онлайн ресурса, собирается прекратить ей добровольную помощь.

Болезни и смерть

В 2013 году калифорнийская организация Heritage Provider Network пообещала $3 млн тому, кто создаст лучший алгоритм для прогнозирования поступления пациентов в больницы. Алгоритм, основанный на данных людей, которые приходят в больницу, сдают анализы в частных клиниках, проходят обследования, учитывает огромное количество показателей: условия жизни в районе, этажность дома, среднее давление, и т.д. Например, при резком изменении погоды, пациенты A B и C с высокой чувствительности к погоде скорее всего попадут в больницу. Использование прогнозной аналитики в медицине поможет спасти жизни, сократить издержки на после временную госпитализацию и продвинуть разработки в этой области на несколько лет вперёд.

На западе страховые компании прогнозируют дату смерти человека с точностью до нескольких месяцев. Система представляет собой, огромное количество данных с датами рождения и смерти, перечнем болезней, причинам смерти и другой информацией по людям, накопленной за десятки лет.

Ложь и мошенничество
интересно всегда
Компания Ford планирует выпустить систему для автомобилей, которая будет анализировать дорожное движение, когда человек едет в машине. Факторы анализируются по аналогии с поисковыми системами: сзади едет машина, слева едет ещё велосипедист. Человек планирует повернуть направо, но, например, система видит, что справа от едет мотоциклист и поворот направо может создать аварийную ситуацию, поэтому система не даёт повернуть направо и начинает медленно тормозить. Система кажется идеальной, но есть одна проблема, если машина сама выкрутила руль влево и предугадала, что человек за рулём не врежется в другой автомобиль, но в вдруг с неба неожиданно упадёт самолёт, то виновата в этом будет система автомобиля Ford. Здесь возникает проблемы с прогнозной аналитикой в целом, если система не может дать гарантированную точность для обеспечения жизни и предсказания чего-либо, она может использоваться не во всех направлениях с точностью на 100%.
В Европе некоторые институты уже давно используют прогнозную аналитику для того, чтобы определить менее преуспевающих в своём обучении студентов. С этими студентами проводятся дополнительные занятия, которые помогают улучшить успеваемость, а заодно средний бал самого института.

На сегодняшний день американская полиция прогнозирует местность, где высокая вероятность преступлений. Прогнозные модели позволяют определить, кто должен находиться тюрьме, а кто наоборот может получить условно досрочное. Машина делает анализ на основе данных по заключённому, собирается как можно больше данных: сколько минут спал, сколько занимался спортом, был ли замечен в драке, как часто навещали родственники и т.д. Считается, что убийства, не поддаются прогнозированию даже с небольшой степенью точности, но в рамках определённых групп риска методики могут быть эффективными. В штате Мерлин используется аналитическая модель, выдающая прогнозы, кто под надзором лиц может быть убитым или может убить.
Поисковый маркетинг
В SEO можно прогнозировать абсолютно всё: поведение людей на сайте, количество трафика на сайт, рост позиций, запросы для продвижения, стоимость клика и заявки с вероятностью в 80%. Собрать данные из счетчиков статистики, метрики, аналитикс, базы данных ключевых слов, внутренней системы CRM , например 1С и внешних источников не составит труда, куда сложнее привести данные к одному виду, проанализировать, интерпретировать и стандартизировать. В SEO прогнозная аналитика полностью завязана на машинном обучении. Все полученные данные отдаются машине, затем она уже строит прогнозы. Так работают и поисковые системы, в том числе Яндекс, поисковая система построена на машинном обучении — матрикснете. Получая данные, миллионы/милиарды строк данных по ручной разметке ассесеров, по качеству и параметрам сайта, машина делает определённый скоринг, ставит оценки каждому сайту и даёт предположение, что определённая группа сайтов относится скорее всего к хорошим сайтам, в результате сайт ранжируется.
В ИТОГЕ
Эти истории не единственные, не первые и далеко не последние, но они показывают нам и доказывают, что прогнозная аналитика применима ко всем сферам в жизни. Мы же используем прогнозирование в SEO и довольно успешно! Используем сами, используем для вас на вашем проекте и хотим научить вас применять ее.

Рассылка без спама и партнеров