Falar de dados nas empresas é correr o risco de ser redundante. Afinal, com o rápido avanço da tecnologia, a geração deles cresce em ritmo exponencial. A questão é saber o que fazer com esse grande volume de informações. Dessa forma, a capacidade para armazená-lo e analisá-lo deve acompanhar a evolução. Não se trata, portanto, de saber como adquirir esses dados, uma vez que os recursos não são mais escassos nem desconhecidos. O dilema atual resume-se em saber quais respostas procurar. Diante disso, o conceito de data lake surge como a opção mais interessante às empresas, seja por sua flexibilidade para armazenar qualquer tipo de informação, seja pela escalabilidade e pelo valor financeiro.

Antes de entender como isso ajuda no processo decisório, vamos às explicações. Um data lake pode ser definido como um repositório que unifica e centraliza dados de diferentes fontes, guardando qualquer informação que seja útil ao negócio. O custo baixo traz a vantagem de armazenar dados em seu estado bruto, sem a necessidade de modificá-los, possibilitando a criação de um histórico completo que simplifique o acesso. Assim, eles são escaláveis por suportarem volumes gigantescos de dados sem se limitarem pela unificação de diferentes sistemas de coleta – e por permitirem que as organizações realizem análises mais complexas e em tempo real. Mais do que isso: o dado em forma bruta oferece uma leitura constante para a resolução de novos problemas.

Saber trabalhar com os dados é um dos grandes desafios das empresas brasileiras. A Pesquisa Global de Gestão de Dados 2020, realizada pela Experian, mostra que metade das companhias do país não confia totalmente nas análises por conta do nível de imprecisão e dificuldade no entendimento dessas informações. Por isso, os custos decorrentes a má gestão dos dados são problemas para 87% das organizações no Brasil. O desafio pode ser ainda maior: levantamento ASG Technologies Group mostra que quase dois terços dos profissionais (63%) confirmaram o uso de dados imprecisos, desatualizados ou ruins como fonte de informação para a tomada de decisão.

O projeto de Data Lake surge justamente para resolver esse problema. Imagine, por exemplo, um grupo de pessoas escalando uma montanha. Seja quem está começando ou quem já é experiente, é preciso ter uma base de apoio para executar os planos. É praticamente a mesma coisa com os dados: independentemente do nível de maturidade da companhia em relação aos dados, esse sistema pode levar o negócio até o próximo nível. Usá-lo apenas como fonte de armazenamento é possível, claro, mas para extrair todo o potencial é necessário desenvolver um verdadeiro projeto de data lake, que serão coletados, transformados e organizados de acordo com as necessidades pontuais, gerando valor, insights e, consequentemente, decisões mais estratégicas.

Ao tirar proveito de todo o seu potencial, o projeto de data lake (que é composto não só por um data lake em si, mas por todo um ecossistema de banco de dados e softwares de ETL (Extract Transform Load), visualização e análise preditiva) é capaz de ampliar o uso de dados no processo de tomada de decisão do negócio. Uma de suas vantagens é aprofundar a compreensão da empresa sobre seu público-alvo, identificando o perfil, as necessidades, os interesses, entre outros. A integração de diferentes fontes de informação também facilita o entendimento sobre o comportamento dos usuários, abandonando a visão única de cenários isolados. Por fim, é possível gerar insights que percorrem toda a extensão da operação, auxiliando e reforçando as decisões estratégicas em diversos níveis do negócio, e facilitar a projeção de diferentes cenários no segmento em que atua.

Não dá para negar a importância dos dados nos processos corporativos atualmente. É claramente o combustível no processo evolutivo de estratégia e tomada de decisão nos negócios. Contudo, tê-los em mãos não é mais garantia de sobrevivência. O segredo é saber quais perguntas devem ser respondidas em meio à infinidade de dados que são coletados e observados. Armazená-los em um mesmo local e deixá-los à disposição quando necessário é o primeiro passo para isso. Até porque as respostas já estão lá; só é preciso fazer agora as perguntas-chave que ajudarão a alavancar o crescimento da empresa.

*Débora Sabidussi é VP of Performance & Data Hub da Cadastra