Правильное получение больших данных — это нечто большее, чем просто размер вашей базы данных.

  • Oct 19, 2023

Большие данные — это не размер, а масштаб — и это может быть больше, чем ваш бизнес.

Каждые несколько месяцев снова разгорается спор о том, какими должны быть «большие» данные, чтобы быть «большими данными». По мере того, как этот термин становится все более знакомым, его также начинают неправильно использовать, и большие данные легко представить как систему, которая делает хранилище данных доступным даже для малого бизнеса.

Однако это упускает из виду.

Большие данные не являются большими, потому что их много. Он большой, потому что охватывает множество областей, в которых вы можете найти информацию, которую ваш обычный набор данных, каким бы большим он ни был, не охватывает.

Прочитай это

Большие данные: чему доверять: науке о данных или шестому чувству начальника?

Прочитай сейчас

Вы можете делать некоторые умные вещи, используя только свои собственные данные, если их у вас достаточно. JJ Food Service Limited потратила три года на продажи Microsoft Dynamics AX (25 миллионов транзакций, в общей сложности 6 ГБ), а также подробную информацию о том, как клиенты используют веб-сайт заказов и используют машинное обучение Azure. услуга. В результате была создана система, которая предварительно заполняет корзину покупок для каждого покупателя, что позволяет им быстрее разместить заказ и снижает вероятность того, что они что-то забудут и пойдут покупать это в другом месте.

Если у вас есть данные о вашем бизнесе, было бы напрасной тратой не попробовать запустить прогнозную аналитику или систему рекомендаций, чтобы увидеть то, чего вы еще не знаете. Azure ML похож на макросы Excel для бизнес-аналитики: вам нужно научиться их использовать, но вам не обязательно иметь докторскую степень и двухлетний опыт программирования R, чтобы получить полезный анализ из это.

Предложение этого в качестве услуги упрощает второй этап работы с большими данными, а именно: как только вы нашли интересные результаты, о которых вы еще не знали — автоматизируйте их как часть своего бизнес. На этом этапе они перестают быть большими данными и превращаются в обычные старые бизнес-идеи, так что вам не придется чтобы их использовать, нужно выполнить множество пользовательских действий: они должны соответствовать тому, как вы ведете свой другой бизнес. процессы.

По крайней мере, прекратите использовать квоты электронной почты и заставлять сотрудников удалять старую почту или помещать файлы PST, которые будут потеряться, когда они обновляют компьютеры, или даже утечь, если они потеряют ноутбук, и превратить его в актив, который они могут поиск.

Служба архивирования, такая как Mimecast (которая подключается к Exchange и Office 365), или инструменты Office 365, такие как Delve. или даже поле поиска в Outlook Web App — превращает старую почту в способ узнать, с кем у вас есть отношения с.

Старые электронные письма и документы — это не мусор, который заставляет вас покупать больше дисков для хранения, они таят в себе огромный потенциал. источник больших данных, как только мы получим больше инструментов для извлечения информации из неструктурированных и полуструктурированных данных. данные. Эти инструменты по-прежнему остаются в основном несбыточными мечтами и исследовательскими проектами, но чем раньше вы начнете думать о бизнесе, информацию всех видов как ресурс, а не жернов, тем больше вы получите от больших данных будущее.

Но наиболее интересными большими данными часто оказываются корреляции с информацией, которой у вашего бизнеса еще нет. Если вы хотите знать, будет ли кто-то представлять собой хороший страховой риск, кто-то, кто будет выплачивать страховые премии вовремя и не предъявлять много претензий, то вам действительно хочу знать, используют ли они защиту от потертостей на своих стульях, потому что люди, которые используют защиту от царапин, представляют собой хорошую страховку (есть некоторые во всем этом интересные вопросы о конфиденциальности: ваша страховая компания не скажет вам, что взимает с вас более высокую ставку, потому что вы не используете потертости. защитники).

Аналогичным образом, если вы хотите быстро получить представление о том, насколько здоров ваш бизнес, выясните, сколько посылок он отправляет и получает (и меняется ли оно значительно с течением времени). Большинство предприятий получают поставки и отправляют продукцию, а также изменения в объеме посылок, входящих и исходящих из компании. расскажет вам много о том, как идет бизнес, именно то, что вы хотите знать, если решаете, стоит ли давать им заем.

Прочитай это

Большие данные: пять самых больших мифов и почему они не совпадают

Прочитай сейчас

Одна крупная компания по доставке посылок, которая уже анализирует всю имеющуюся информацию о доставке, размещает склады в нужных местах и ​​набирает достаточное количество курьеров, поняла это и начал побочный бизнес, взяв всю эту историю пакетов, проведя ее аналитику и предоставив результаты этой аналитики финансовым компаниям, которые управляют кредитами и кредитами. рейтинги.

Это напоминает, возможно, самое раннее известное использование больших данных: установление цен на бензин.

Когда коммерческая компания, выпускающая бензиновые карты, поняла, что у нее есть не просто запись о том, сколько клиенты должны были заплатить в конце месяца, а огромная географическая база данных Чтобы узнать, сколько стоит бензин в разных местах по всей Великобритании, он обратился к Esso и спросил, хотят ли они точно знать, сколько они могут взимать, и при этом иметь самый дешевый местный бензин. бензин.

Эссо ухватился за эту возможность. Сейчас все нефтяные компании покупают данные о ценах прямо у заправки, но в течение нескольких лет (пока Esso имела эксклюзивный доступ к данным) она имела большое преимущество перед конкурентами.

Урок заключается в том, что то, что вам больше всего нужно знать о вашем рынке или ваших клиентах, может отсутствовать в имеющихся у вас данных - и что имеющиеся у вас данные могут содержать информацию, которую могла бы использовать какая-то другая компания.

Узнайте больше о больших данных

  • Microsoft предложит платную версию своего внутреннего сервиса обработки больших данных Cosmos
  • Недовольны большими данными? Может быть, это та самая визуализация, зависимость от волшебного ящика
  • Большие данные означают большие медицинские прорывы