Embora as origens do termo sejam indescritíveis e até mesmo debatidas, o big data é um dos conceitos que muitos conhecem, mas desafia uma definição simples. No coração do big data, como o termo sugere diretamente, é um volume extremamente grande de dados. Isso é freqüentemente extraído de diversas fontes e até mesmo diferentes tipos de dados, que são então confundidos por técnicas analíticas avançadas que, espera-se, selecionam padrões que podem levar a conclusões úteis..

Big data também infere os três Vs: Volume, Variety e Velocity. O volume refere-se ao tamanho dos dados, a variedade indica que os conjuntos de dados não são homogêneos e a velocidade é a velocidade na qual a análise ocorre, geralmente com o objetivo de obter uma análise em tempo real..

Os conjuntos de dados envolvidos são realmente muito grandes - estamos falando de terabytes para zetabytes (1ZB equivale a 909.494.701 TB, para os curiosos). Além do tamanho desses conjuntos de dados, os dados podem ser de diferentes tipos: estruturados, semi-estruturados e não estruturados, além de poderem ser extraídos de várias fontes.

Isso faz a pergunta de onde todos esses dados estão sendo gerados. Ele vem de todos os tipos de lugares, incluindo a web, redes sociais, redes, arquivos de log, arquivos de vídeo, sensores e dispositivos móveis..

Os últimos são particularmente importantes, pois a maioria de nós mantém nossos telefones conosco 24 horas por dia, 7 dias por semana, e eles têm uma série de sensores, incluindo GPS, câmeras, um microfone e um sensor de movimento. Além disso, a maior parte do uso de smartphones não é a comunicação por voz, mas sim outras atividades, incluindo e-mails, jogos, navegação na web e aplicativos sociais - o que se traduz em 90% de uso de aplicativos móveis. Um grande driver de big data são esses dados móveis, que são gerados em um ritmo alucinante.

Mineração de dados

Mas dados sem qualquer análise dificilmente valem muito, e essa é a outra parte do processo de Big Data. Essa análise é conhecida como mineração de dados e procura pesquisar padrões e anomalias nesses grandes conjuntos de dados. Esses padrões geram informações que são usadas para várias finalidades, como melhorar campanhas de marketing, aumentar as vendas ou cortar custos. A abordagem de big data e mineração de dados não só tem o poder de transformar indústrias inteiras, mas já o fez.

Por exemplo, a Trainline é uma importante varejista independente de bilhetes de trem na Europa, vendendo passagens domésticas e internacionais em 173 países, com aproximadamente 127.000 viagens diárias feitas pelos clientes. A empresa utilizou big data para modernizar sua abordagem de viagens, com foco em melhorar a experiência do cliente por meio de inovação por meio de seu aplicativo.

Os resultados são que agora os clientes recebem notificações aprimoradas de interrupção por meio do aplicativo. Mais do que apenas notificações de atrasos, essas notificações aprimoradas são específicas para a jornada de cada viajante, a primeira para a indústria ferroviária do Reino Unido. A empresa também inovou em termos de precificação preditiva, que é capaz de prever quando as tarifas antecipadas subirão com a taxa de desconto inicial, permitindo que os passageiros comprem tarifas a preços mais baixos..

O big data também tem sido usado em restaurantes e, em particular, na indústria de fast food. O McDonald's é a maior rede de restaurantes do mundo em receita e atende mais de 69 milhões de clientes diariamente em mais de 36.900 locais em mais de 100 países.

Devido apenas ao volume, toneladas de dados são gerados e, portanto, o McDonald's adotou uma cultura orientada por dados, com o objetivo de melhorar sua compreensão no nível de cada localidade individual, com o objetivo geral de uma melhor cadeia de restaurantes..

Por meio de big data, o McDonald's otimizou sua experiência de drive-through, por exemplo, tomando nota do tamanho dos carros que chegam e se preparando para um aumento na demanda quando carros maiores entram na fila..

Outra grande inovação de dados tem sido aquelas exibições de menu digital que podem mostrar itens de menu com flexibilidade, com base em uma análise em tempo real dos dados. Os menus deslocam os itens destacados com base nos dados, incluindo a hora do dia e o tempo no exterior, especificamente promovendo bebidas frias quando está calor lá fora e mais alimentos de conforto nos dias mais frios. Essa abordagem impulsionou as vendas em locais no Canadá em um percentual de 3% a 3,5%.

Questões de saúde

Essa abordagem de Big Data também foi aplicada à saúde. Um exemplo óbvio é o grande afastamento dos gráficos de 'caneta e papel' em que os dados de seu médico são arquivados em um arquivo no escritório, para a Electronic Health Records (EHR), que agora tem todas as informações do paciente inseridas em um banco de dados de computador pronto para ser minado.

Esta abordagem promete ser disruptiva, com uma publicação recente no European Heart Journal prometendo “potencial para melhorar nossa compreensão da causação de doenças e classificação relevante para a tradução antecipada e para contribuir com análises acionáveis ​​para melhorar a saúde e os cuidados de saúde”.

Os benefícios do Big Data na área de saúde vão além da mineração de dados do EHR. Um desafio significativo para os hospitais é o pessoal, que tem que ser adequado em todos os momentos, com o potencial de aumentar durante os períodos de pico.

Em um grupo de quatro hospitais de Paris que compõem a Assistência Publique-Hôpitaux de Paris (AP-HP), eles buscam melhorar a flexibilidade na contratação de pessoal. Eles usaram um conjunto de dados de 10 anos de registros de admissão hospitalar, até um nível granular do número de internações por dia, bem como a hora do dia, e combinaram isso com dados meteorológicos, padrões de influenza e feriados públicos..

Usando o aprendizado de máquina, eles aperfeiçoaram seus algoritmos para tendências futuras para prever o número de admissões futuras para dias e horários diferentes. O resultado é que agora eles têm uma interface fácil de usar, baseada em navegador, para administração hospitalar, bem como uma equipe clínica capaz de prever as taxas de admissão nos próximos 15 dias, que é usada para obter pessoal extra quando número de admissões é antecipado.

Com os dados, e em particular os dados móveis sendo gerados a uma taxa ridiculamente rápida, a abordagem de big data é necessária para transformar essa enorme quantidade de informações em inteligência acionável. Nos exemplos citados acima, o desafio foi atingido e, à medida que mais dados forem coletados, haverá mais oportunidades para aumentar a qualidade e a eficiência em diversos setores, por meio de uma análise mais rápida e melhor desses conjuntos de dados dispersos e dispersos..

  • Também perguntamos: o Big Data é um grande fracasso??