admin / 20.02.2018
Под обобщающим термином «большие данные» принято понимать любые наборы данных, достаточно большие и сложные для того, чтобы их можно было бы обработать традиционными средствами работы с данными (например, РСУБД – реляционными системами управления базами данных). Единого мнения о том, какой объём считать «достаточно большим», нет, но нужно помнить, что сам термин «большие данные» — это не только про объём данных.
С данным термином связывают концепцию «Volume, Velocity, Variety, Veracity, Value» – принципы, на которых строится работа с большими данными. Это непосредственно объем информации, быстродействие её обработки, разнообразие сведений, хранящихся в массиве, достоверность этих данных, а также их ценность. То есть, она должна быть полезной и нужной в теоретическом или практическом плане, что оправдывало бы затраты на ее хранение и обработку.
Big Data – это не только сами данные, но и технологии их обработки и использования, методы поиска необходимой информации в больших массивах. Проблема больших данных по-прежнему остается открытой и жизненно важной для любых систем, десятилетиями накапливающих самую разнообразную информацию.
Технологии больших данных можно разбить на несколько основных категорий (экосистема больших данных):
Большие данные встречаются повсеместно как в коммерческих, так и в некоммерческих средах. Количество потенциальных применений огромно и включает в себя такие сферы (но не ограничивается ими): маркетинг, образование, медицина, биология, финансы, безопасность и др.
Источники больших данных: социальные сети, датчики, текст, видео, изображения, логи веб-сайтов, данные масштабных экспериментов, геопространственные данные и др. В большинстве случаев данные неструктурированы или полуструктурированы.
Таким образом, понятие больших данных подразумевает работу с данными огромного объема и разнообразного состава, часто обновляемой и находящейся в разных источниках в целях увеличения эффективности работы, создания новых продуктов и повышения конкурентоспособности.
Big Data или большие данные — это серия подходов, инструментов и методов обработки структурированных, слабо структурированных и неструктурированных данных огромных объёмов и значительного многообразия для получения воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence. В данную серию включают средства массово-параллельной обработки неопределённо структурированных данных, прежде всего, решениями категории NoSQL, алгоритмами MapReduce, программными каркасами и библиотеками проекта Hadoop.
В качестве определяющих характеристик для больших данных отмечают «три V» — volume (объём), velocity (скорость), variety (многообразие).
В реальности, только очень крупные компании обладают большими данными в истинном понимании этого термина, так как даже несколько террабайт накопленной статистики таковыми просто не являются. Террабайтная реляционная база данных — это highload-DB, а не Big Data. Разница между этими понятиями в возможности строить гибкие запросы. Обычные реляционные базы данных подходят для достаточно быстрых и однотипных запросов, а на сложных и гибко построенных запросах нагрузка просто превышает все разумные пределы и использование СУБД становится неэффективным. При этом, методы анализа Big Data вполне применимы и к данным, которые изначально большими не являются, более того, аналитика, построенная на статистическом анализе и машинном обучении может быть полезна во многих проектах.
Некоторые методы и техники анализа, применимые к Big Data
.
В рамках серии конференций ClickZ Live New York, проходивших в этом году, состоялся круглый стол, участники которого пытались получить ответ на животрепещущий вопрос: действительно ли Big Data работают на маркетологов, и каким именно образом?
Большие Данные уже давно не являются новомодным маркетинговым термином. На смену этим некогда загадочным словам пришли другие buzz words — «маркетинговое облако контента», «второй экран», «геймификация» и др.
Для начала необходимо понять, работают ли на маркетологов небольшие фрагменты данных или какая-либо их аналитика. Слишком многие специалисты, несмотря на появление дата-технологий и интеграцию социальных сетей и таргетинга с решениями CRM, не умеют оптимизировать свои локальные data-процессы, не говоря уже об обработке больших массивов мультиструктурированных данных в режиме реального времени. Поэтому начинать нужно с базовых объемов, постепенно добавляя в маркетинговый микс больше данных и динамики.
Эксперты круглого стола Clickz Live выделили 5 аспектов рекламных кампаний, на которые может повлиять правильное использование Big Data.
1. Сегментация. Имея доступ к обновляющимся массивам пользовательских данных, вы можете отказаться от классической модели списков и начать работать по схеме 1:1 (персонализированный, клиентоориентированный маркетинг). Если вы психологоически готовы к этому шагу и имеете технологическую основу для сбора и обработки актуальных данных в реальном времени — вперед, к 1-2-1 маркетингу! Это в корне изменит правила игры в целом и методы использования Больших Данных в частности.
2. Прототипы. В цифровом маркетинге под этим термином подразумевают определенный набор пользовательских характеристик, представляющий ту или иную группу целевой аудитории. Несмотря на то, что этому принципу сегодня часто предпочитают размещение, основанное на статистике посещений и интересах аудитории, прототипы все еще играют важную роль в современном маркетинге. Большие данные помогают формировать более точные и динамические прототипы, что, соответственно, увеличивает шансы на попадание в цель при аудиторных закупках для той или иной таргетированной кампании.
3. Социальная аналитика. Социальные сети — идеальная область применения больших данных, даже если вы не используете их при работе с другими аспектами кампаний. Упорядочивайте разрозненную информацию из постов, комментариев и твитов, чтобы понимать своих клиентов лучше и обращаться к каждому максимально персонализированно.
4. Оптимизация коммуникационного канала. Оптимизировать каждый отдельно взятый канал, не говоря уже о мультиканальной оптимизации на потребительском уровне — это очень непростая задача. Большие Данные могут помочь маркетологам понять, что важно в данный конкретный момент. Big Data могут быть на самом деле полезными, если маркетолог хочет прийти к пониманию того, какие клиенты являются наиболее ценными в рамках каждого канала. Платформы, посредством которых осуществляется управление Большими Данными, могут обрабатывать как структурированные, так и не структурированные данные. Так что исследователям рынка действительно нужно включать в свой анализ статистику webstream, clickstream и социальные данные.
5. Естественная реклама. Могут ли Большие Данные помочь оперативно собирать, организовывать и отображать контент? Могут ли они передавать в «командный центр» информацию, которая бы помогала увеличивать эффективность предложений в ключевых точках взаимодействия с клиентом? Да.
Актуальные, обновляющиеся данные, несомненнно, могут играть ключевую роль в становлении и развитии Native. Конечно, работа с Big Data и алгоритмами предполагает риск чрезмерной зависимости от автоматизации процессов, что, по идее, с трудом укладывается в концепцию контент-маркетинга. Но ошибок бояться не стоит, гораздо интереснее на них учиться.
Источник: clickz.com
FILED UNDER : IT