No início dos anos 2000, Doug Laney, analista e vice-presidente da Gartner, líder mundial em pesquisa e consultoria em tecnologia da informação, propôs uma definição prática sobre Big Data, tendo como base os três V: variedade, velocidade e volume. O termo se refere a análise e interpretação de um alto volume de dados armazenados. O sistema funciona a partir de soluções específicas, desenvolvidas por profissionais de TI, para que os detentores de Big Data possam trabalhar com a partir da obtenção das informações, estruturada e não estruturadas. Com o amadurecimento do conceito e desenvolvimento tecnológico, foram adicionados mais dois V, incluindo assim o valor e veracidade.
Explico: volume diz respeito a alta geração de dados por segundo; variedade é a fonte ilimitada de dados; velocidade, processo de leitura para gerar as informações em tempo ágil; valor é o esforço para gerar informações úteis, a fim de entender o contexto e necessidades específicas; veracidade, certificação de que as fontes e resultados.
Quanto mais fontes de dados, maior a complexidade de trabalhá-los, mas também maior a probabilidade de gerar uma informação útil. O grande desafio do Big Data, visto que a variedade e o volume de dados é enorme, é o processamento que deve ser habilidoso ao gerar as informações necessárias. O emaranhado de dados pode ser confuso às vezes, por isso é muito importante conhecer as fontes de pesquisa e se certificar que a informação é verdadeira.
Por serem mais flexíveis que os bancos de dados tradicionais, as soluções de Big Data, que também suportam aplicações com volumes de dados que crescem gradativamente todos os dias, tem tomados grandes proporções no mercado. Além disso, suas aplicações, conceitos e técnicas são particulares para cada tipo de negócio, ao que auxilia as empresas a interpretar os dados e, consequentemente, a ter maior estabilidade para criar estratégias e alcançar objetivos.
Dentro do Big Data, temos dois tipos de informação: os dados estruturados que possuem uma organização determinada com clusters, categorias, definições de localização, vendas, contatos e até perfil dos clientes. E os dados não estruturados que necessitam de intervenção humana, neste casos, falamos de mídias sociais, onde é possível realizar o monitoramento através de boots ou ferramentas específicas, mas ainda assim o filtro mais confiável para o levantamento de dados se dá por meio do trabalho humano.
Além disso, temos três tipos de Big Data: Social Data, dados proveniente de pessoas e informações sobre padrões de comportamento; Enterprise Data, gerados por empresas como dados financeiros e operações rotineiras, essenciais para medir a produtividade; e Personal Data, método relativamente novo, relacionado com a Internet das Coisas, onde é possível a geração de dados a partir de dispositivos conectados a internet. Tendo todas essas informações em mente, é hora de analisar qual o perfil mais indicado de banco de dados para o seu negócio. Existem infinitas possibilidades a partir de todas essas funções mencionadas, que pensadas e escolhidas com cautela, podem proporcionar grandes resultados.
Helmuth Hofstatter é especialista em gestão de produtos e nas mais diversas soluções voltadas ao comércio exterior. É fundador da LogComex, startup de big data, inteligência e automação para logística internacional.