O que é Small Data?

Fonte: Capa do Livro Small Data de Martin Lindstorm
Vivemos no mundo do Big Data. Todos nós sabemos disso!
Small Data são dados suficientes para a compreensão humana. São volumes de dados em formatos que os tornam acessíveis, informativos e acionáveis.
Há muitos problemas em uma organização que exigem análise rápida e instantânea. Em casos como esses, não há necessidade de usar ferramentas analíticas de Big Data.
O termo “Big Data” é sobre máquinas e “Small Data” é sobre pessoas.
A única maneira de compreender o Big Data é reduzir os dados em volumes menores que possam ser interpretados visualmente, representando vários aspectos de grandes conjuntos de dados (como gráficos, histogramas e gráficos de dispersão). O Big Data trata de encontrar correlações, mas o Small Data trata de encontrar a causa, um diagnóstico, uma razão.
No entanto, apenas porque Big Data é mainstream não significa que faz sentido para todos os cenários de tomada de decisão. Muito pelo contrário, muitas pessoas conversaram, escreveram e tentaram definir Big Data para os não cientistas ou engenheiros de dados, e ninguém sabe realmente por onde começar a preparar o Big Data. Certo?

Fonte: The Greatness Of Small Data - Why Businesses Should Capitalize And Focus On This Resource (CustomerThink)
Uma definição formal de Small Data
“Small Data conectam as pessoas com informações oportunas e significativas (derivadas de Big Data e/ou fontes locais), organizado e empacotado geralmente para ser acessível visualmente, compreensível e acionável para as tarefas diárias.”
Paradoxalmente, o Big Data é mais eficaz para apenas uma parte das decisões que uma organização toma, com muita frequência. Um exemplo: “que plano de desconto devo oferecer a esse cliente?” ou “que outro produto devo recomendar a esse cliente que acabou de comprar este livro?” ou “qual a probabilidade de ocorrer uma fraude na transação financeira?”
Por outro lado, as grandes decisões têm características diferentes que geralmente não são tão bem suportadas pelo Big Data (ou máquinas de decisões, usando Machine Learning, por exemplo). Agilidade e visão humana são frequentemente mais importantes que a automação, na maior parte da tomada de decisões.
As organizações Data Driven sabem que os conjuntos de dados menores (Small Data) bem trabalhados, juntamente com modelos avançados usando Big Data, são a base para os melhores resultados de decisões.
Acredita-se que nos tornamos tão focados no Big Data que tendemos a esquecer conceitos e criatividade mais básicos.
As organizações devem reconhecer a diferença entre situações que exigem grandes quantidades de informações altamente detalhadas (exigindo esforços demorados de migração e limpeza) e aquelas em que a agilidade é muito alta e em que conjuntos de dados imperfeitos ou incompletos são uma escolha melhor. Sem essa distinção, podemos ser vítimas de “limpeza gratuita de dados”: um exercício caro, arriscado e demorado.

Fonte: Small data - os dados que fazem a diferença (Iberdrola)
Small Data na prática
Uma das melhores formas de entender o significado de um conceito é enxergando como ele acontece na prática. Por isso, é importante que você conheça a história da Lego, uma das maiores fabricantes de brinquedo do mundo, descrita por Martin Lindstrom no livro Small Data: the tiny clues that uncover huge trends (em português, Small Data: como poucas pistas indicam grandes tendências).
O autor, que atua como consultor de comportamento do consumidor para grandes empresas, entrevistou 2 mil famílias em mais de 77 países para conhecer seus hábitos e auxiliar a Lego a conhecer melhor o seu público-alvo. Lindstrom foi a campo e conversou com os consumidores da empresa com o objetivo de entender o que de fato lhes interessava na sua oferta.
Foi com o uso de Small Data que a Lego conseguiu identificar as informações necessárias para mudar o cenário crítico que enfrentava na época. Isso porque, segundo o consultor, enquanto eles usavam Big Data e o seu enorme volume de dados para relacionar informações, os pontos-chave para o negócio se perdiam. E a lição que tiramos disso é que os verdadeiros resultados somente apareceram com o uso de Small Data, pois é esse o método que tem como preocupação encontrar as causas e motivos de um problema de negócio.
Um breve resumo da história recente para ficar mais claro
Com o avanço da digitalização dos negócios, a chegada da Internet da Coisas e 5G, passamos a criar volumes gigantescos de dados, que só tende a aumentar nos próximos anos.
Vamos precisar de soluções e tecnologias de Big Data para minerar e automatizar todos estes fluxos de dados, com o objetivo de criar valor. Após a etapa de preparação dos dados ou mesmo antes, se forem significativos para uma análise, estes dados estarão cada vez mais disponíveis para que todos os profissionais de uma organização contribuam na tomada de decisão. Este é um dos princípios do Data Driven.
Em resumo, as empresas precisam de uma combinação de Big Data (com tecnologias e algoritmos de machine learning) e Small Data (através de pessoas preparadas com o perfil analítico para tomada de decisões baseadas em dados). Padrões com a abordagem de self-service BI, democratização dos dados e Small Data, estão contribuindo para criar empresas mais inteligentes.
Por Anderson Paulucci (Co-Fundador triggo.ai)