Data Lake Vs Data Warehouse: entenda a diferença

Data Lake é o nome do conceito utilizado para armazenar grandes volumes de dados em um único lugar, independente do seu formato.

A ideia do Data Lake é ter um único repositório dentro da empresa para que todos os dados brutos estejam disponíveis para qualquer pessoa que precise fazer análise deles.

Nele você armazena qualquer tipo de dados e somente na hora de realizar a leitura desses dados é que você vai definir como eles deverão ser estruturados.

O Data Warehouse é o oposto disso. Para criá-lo é necessário estruturar os dados antes e definir como eles serão armazenados.

Enquanto um Data Lake armazena qualquer tipo de dados como, por exemplo, arquivos, imagens ou dados de sensores, o Data Warehouse armazena primariamente dados estruturados.

Primeiro você define a organização dos dados e depois você os armazena dentro do que foi especificado.

Entendido? Se ficar alguma dúvida conte com o time da Jebs para resolvê-las!