Dark Data é um termo menos conhecido e não tão glamouroso como Big Data, mas muitas empresas tem coletado esse tipo de informação e gasto muito dinheiro armazenando, sem necessariamente fazer uso das mesmas.

A maioria das empresas tenta acumular todas as informações transacionais possíveis de um cliente, e concentram suas análises nesses dados, tais como históricos de compras, endereços fornecidos, números de cartão, mas muitos outros dados são coletados nesse processo e nem sempre são considerados, como, por exemplo, o horário em que determinado cliente acessa, se a conexão era mobile ou desktop, ou mesmo a localização física onde o cliente fez a compra.

Os dados considerados como Dark Data são um subproduto na aquisição dos dados transacionais, muitas vezes armazenados, mas poucas vezes considerados na solução de problemas e detecção de padrões. São dados armazenados muitas vezes para comprovar que uma determinada ação ocorreu, mas que são obsoletos do ponto de vista operacional da empresa.

Alguns exemplos de Dark Data:

  • Dados gerais de clientes
  • Dados de compras já entregues
  • Dados de pedidos já recebidos
  • Arquivos de logs
  • Extratos de contas
  • Dados de ex-empregados
  • Declarações financeiras
  • Dados brutos de pesquisas (respostas)
  • E-mails antigos
  • Anotações ou apresentações
  • Versões anteriores de documentos relevantes

Enfim, a geração desse tipo de informação não tem fim.

Quais os perigos?

Muitas vezes algumas dessas informações são sensíveis e devem ser protegidas contra violação, vazamento e perda como outras informações, isso implica em altos custos para manter esses dados nem sempre relevantes.

Também tem a tendência de se acumularem muito rapidamente e com isso aumentar os custos de processamento, armazenamento e backup dessas informações, prejudicando performance em sistemas críticos de maior relevância mesmo que esses dados não sejam utilizados

Quais as oportunidades?

Com esse tipo de informação muitas questões do negócio podem ser respondidas, por exemplo:

  • Existem clientes que compram em lojas do mesmo grupo em diferentes localidades?
  • Eles compram os mesmos produtos nessas lojas?
  • Existe um horário ou dia da semana em que determinado cliente costuma comprar?
  • Existe um horário que um determinado cliente lê nossos e-mails? Isso coincide com a compra? Será que se aproximarmos o horário que enviamos o e-mail com o horário que ele normalmente compra, ele passará a comprar mais?
  • Nossos servidores de e-commerce tem entregado todas páginas com alta performance? A taxa de fechamento das vendas está relacionado com a performance das páginas? Existe alguma região do país onde a performance é baixa? Compensa colocar um servidor mais próximo desses clientes para melhor atendê-los?
  • Existem clientes de uma determinada região que tem demandado mais serviços que os demais? Nessa região existe algum fator crítico de infraestrutura que nos impede de atender bem o cliente? É possível reverter isso?

Case prático

Um exemplo prático ocorreu com a Gate Gourmet, uma empresa que presta serviços de alimentação para companhias aéreas na Suíça. A Gate Gourmet tinha uma baixa taxa de satisfação entre os funcionários.
Depois de analisar dados demográficos entre os funcionários que haviam saído da empresa, descobriram que boa parte da insatisfação poderia estar relacionada com a distância de moradia dos funcionários aos aeroportos e os meios de transportes disponíveis.
A Gate Gourmet mudou seu processo de contratação depois disso, passando a levar em conta esse tipo de informação e viu seus índices melhorarem significativamente.

E para sua empresa?

Claro que ninguém vai começar a levantar novas questões e descobrir novas constatações do nada, é preciso iniciar um processo de análise de dados, gestão a vista e descoberta de dados com uma ferramenta de Business Inteligence, com suporte a Data Analytics e Data Discovery.
Talvez os primeiros passos sejam confusos, inseguros e tortuosos, mas a prática leva a perfeição, então o primeiro passo é começar.

 

Leia também esse artigo da IDG Connect: What awaits discovery within ‘dark data’?

 

Referência do case: IDG Connect

 

 

Sobre o autor
Fernando Ulisses dos Santos
Diretor de Tecnologia na Blue Solutions
Especialista em Segurança da Informação
Certificado VCP-DCV, VCAP-DT, VCP-DT

 

No