Большие данные в облаке

Big data в облаках: вызов принят

Что такое big data?

Интерес к big data возрастает так же быстро, как объем данных, который нужно обрабатывать с помощью этого подхода. Основу больших данных определяют так называемые пять V:
  • volume (объем);
  • variety (неоднородность);
  • velocity (скорость прироста и обработки информации);
  • veracity (достоверность данных);
  • value (ценность накопленной информации).
По сути big data — это не только огромные объемы структурированных и неструктурированных данных, но и совокупность подходов и методов их обработки. Качественный анализ данных позволяет представить его результаты в понятном и удобном формате, а также помогает найти неочевидные закономерности, строить прогнозы и стратегически важные выводы для развития компании.
Сфера применения технологий больших данных широкая. Так, с помощью больших данных можно узнать о предпочтениях клиентов, провести анализ рисков, оценить результаты маркетинговых кампаний и др. Многие компании используют решения Google, Яндекса и Facebook, анализирующие ключевые слова поиска и информацию об интересах пользователях, для запуска таргетированной рекламы.
Технологии big data получили широкое распространение во многих сферах бизнеса и уже давно не считаются уделом лишь IT-гигантов. Технологии обработки и анализа данных играют значительную роль в развитии компаний и все чаще применяются средним и малым бизнесом для реализации своих задач.
Эксперты утверждают, что за четыре года (с 2015 по 2019) совокупный доход в области программных решений big data и бизнес-аналитики увеличится с 122 до 181 миллиардов долларов, а к 2020 — в решения business intelligence будут привлечены около 40 % инвестиций IT-сектора.

Подходят ли облака для анализа больших данных?

Сегодня инструменты для обработки больших данных все чаще размещаются на облачных платформах, хотя возможность выполнять аналитические задачи в дата-центре клиента тоже популярна.
Ключевые требования среды для работы с big data включают в себя:
  1. Масштабируемость. Из-за высокого и быстрого прироста данных любая система всегда должна быть готова к расширению.
  2. Отказоустойчивость. Какая-то часть машин в кластере, проводящих анализ, гарантированно будет выходить из строя, последствия этого не должны сказываться на процессе обработки информации.
  3. Безопасность. Недопустимость утечки конфиденциальной информации компании.

Рассматривая облачные решения для big data, видим, что трем вышеуказанным критериям они соответствуют. Гибкость облака является идеальной для проведения анализа больших данных, так как по мере накопления информации можно увеличивать размеры хранилища. Но, наверное, самым большим преимуществом облаков является ускорение и оптимизация доступа к данным, а значит и возрастающая скорость их обработки плюс значительная экономия на обслуживании серверов, установке и обновлении программного обеспечения.

Облачные технологии для big data

Решения по анализу больших данных внедрены во многих крупных компаниях, которые смело используют облачные решения для построения инфраструктуры. Опрос, проведенный компанией Economist Intelligence Unit в 2015 году, подтверждает эту тенденцию. В нем приняли участие 550 топ-менеджеров американских IT-предприятий, сталкивающихся в своей деятельности с big data processing.
Итак, исследование показало:

69% компаний используют облачные решения для хранения больших данных или резервного копирования
В первую очередь, облака притягивают низкими расходами на содержание системы хранения, но если платить за хранение своих петабайтов из года в год, это может сильно ударить по бюджету компании. Неоспоримое преимущество — масштабируемость. Производительность облачных продуктов можно изменять под определенные задачи и платить только за использованный ресурс.
68% компаний облачные сервисы нужны для управления большими данными и получения доступа к ним
Облачные решения позволяют IT-специалистам работать с big data из любой точки мира. Многие облачные гиганты также предлагают свои сервисы для развертывания приложений больших данных — например, Microsoft HDInsight, Amazon Web Services’ Elastic MapReduce или Google Big Data.
56% компаний проводят анализ больших данных, используя облачные решения

Мощные вычислительные комплексы в дата-центре провайдера помогают реализовать аналитические задачи высокого уровня, включая бизнес-аналитику, пакетную обработку, потоковую обработку, машинное обучение и оркестрацию рабочих процессов. Их используют в здравоохранении, телекоммуникациях, торговле, логистике, в финансовых компаниях и других областях.

Обработка данных в облаках

Согласно другому исследованию, проведенному аналитическим центром BARC в 2015 году, для выполнения обработки big data пользователи чаще всего переносят в облака свои реляционные базы данных или применяют для анализа облачные инструменты business intelligence.

Реляционные базы данных

Их размещают в облаках около 26% опрошенных, планируют использование — 7%, 29% считает решение о переносе РБД в облачные сервисы приемлемым.

Облачные провайдеры предлагают специализированные услуги по размещению РБД. Например, в 2009 году Amazon запустил сервис реляционных баз данных — Amazon RDS. Сервис предоставляет клиенту все необходимое для работы с базой данных и возможность масштабировать свою БД в зависимости от нагрузки на приложение. Свои решения предлагают и другие провайдеры, например Microsoft Azure SQL Database или Google Cloud SQL.

Свои услуги для размещения реляционных баз данных под управлением MySQL, Postgresql или MS SQL предлагает и компания Colobridge. Мы можем подготовить спецификацию по запросу и предложить проекты для физической инфраструктуры от выделенного сервера до частного облака или виртуальной инфраструктуры.

Инструменты Business Intelligence

Облачные решения для BI предлагают пользователю легкий и быстрый анализ большого объема данных для поиска новых стратегических бизнес-решений. К ним относятся электронные таблицы, инструменты визуализации, аналитическая обработка онлайн, data mining и другие. Конкретные примеры, активно используемые бизнесом в разных странах, включают такие продукты, как SAP BusinessObjects BI, IBM Cognos, Microsoft Power BI, Oracle Business Intelligence Foundation Suite.
Компания Colobridge предлагает различные решения для развертывания business intelligence приложений в облаке. Среди преимуществ BI-приложений, размещенных в облаке, отмечается: полный спектр функций для BI, включая извлечение, управление и анализ данных, а также высокая надежность, гибкость расходов и удобный интерфейс.

Опрос показал, что BI-приложение, развернутое в облаке, используют 14% опрошенных, в то же время планируют их использование вдвое меньше респондентов — 7%, возможным для реализации своих целей считают это решение 36%.

Заключение

Перенос и анализ больших данных в облаке успешно применяется многими компаниями. Конечно, требования по адаптации облачных сред к big data, в частности улучшение производительности хранилищ и ускорение процесса обработки информации, повышаются, но уже сейчас облачные решения для больших данных показывают неплохие результаты.
Эксперты прогнозируют рост популярности big data анализа в 2017 году до 59% (по сравнению с 34% респондентов, заявивших об использовании этих технологии в 2015), а к 2017 году анализ данных (пусть даже небольших) в облачных сервисах будут осуществлять уже не 37% (2015), а 69% опрошенных — то есть абсолютное большинство.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *