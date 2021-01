Cada vez mais a limpeza e a etiquetagem de dados, conhecida pelos termos em inglês data cleaning (ou data wrangling e data labeling), são movimentos promissores dentro das soluções de Machine Learning e Inteligência Artificial – IA. A prova disso é que, recentemente, startups do exterior, como Labelbox e Trifacta que fazem a organização e limpeza de dados através de processos automatizados e tecnológicos receberam investimentos significativos de fundos. No Brasil, startups dedicadas a essa etapa, ainda não estão nos holofotes dos fundos de investimentos. Mas deveriam!

Para entender a importância dessa tecnologia, é só pensar no exemplo a seguir: se os dados são como o novo petróleo, em termos de valores, para que se possa produzir uma “gasolina premium”, é necessário o processo de refino. Ou seja, assim como no caso dos combustíveis, existe uma cadeia produtiva que é um processo de transformação do petróleo bruto em gasolina. Aplicando essa mesma lógica ao dado, os dados brutos são colhidos internamente e externamente e a utilização desses dados para fins de inteligência artificial prescinde de uma etapa de “limpagem”, tratamento e modelagem dos dados. É aí que entram os processos de data cleaning e data labeling.

Esses são processos necessários quando as empresas querem, por exemplo, fazer predições ou obter insights com os dados produzidos internamente ou externamente. Para isso, é preciso ter dados limpos e estruturados sobre o próprio negócio.

Aqui no Brasil este é um setor que ainda não tem a atenção dos investidores, porém algumas startups tomaram essa frente. Elas desenvolvem tecnologias para data labeling e data cleaning (“tratamento” nos dados) para fins de analytics e IA para gestores tributários. Algumas surgiram para acelerar a transformação digital dos departamentos tributários e fiscais das empresas e está mais que comprovado que essas soluções fazem a diferença no mercado.

É com o trabalho de criar soluções de tecnologia tributária por assinatura para empresas do segmento de enterprise, que algumas startups ganham destaques e conseguem otimizar processos e reduzir custos operacionais através de robotização e data analytics.

Esse é o futuro, o Brasil não pode ficar de fora desse caminho. Precisamos de mais visibilidade para startups desse segmento. Mais investimento!

*Pedro Lima, CEO e fundador da Taxcel