top of page
Topo
Buscar

Reginaldo Silva
25 de mar. de 20244 min de leitura
Databricks - SQL Warehouse - Workflows Jobs - TIMEOUT
Evite custos desnecessários e force os desenvolvedores a criarem queries performáticas com a utilização dessa configuração.

Reginaldo Silva
26 de fev. de 20246 min de leitura
Databricks - Deletion Vector - Photon - Preditictive IO - Comparando a performance
Nesse post vamos comparar a performance do Deletion Vector e a engine do Photon.


Reginaldo Silva
16 de out. de 202310 min de leitura
Databricks - Delta Lake - Particionar ou não, eis a questão! Guia definitivo!
Nesse post veremos como funciona o particionamento de dados e quando vale a pena utilizar.


Reginaldo Silva
17 de jul. de 20233 min de leitura
Databricks - 7 TB - 127 BILHÕES de linhas - Truncate table vs Delete?
Você sabe qual é mais performático, truncate table ou delete?

Reginaldo Silva
19 de jun. de 20233 min de leitura
DTSTOOLS - Descubra o verdadeiro tamanho do seu Delta Lake
A DTSTOOLS é uma biblioteca para te ajudar com seu Delta Lake e reduzir custos de storage


Reginaldo Silva
5 de jun. de 20239 min de leitura
Delta Lake - Time Travel vs Change Data Feed (CDF) - O que você precisa saber
Nesse post você irá conhecer as particularidades do Time Travel e o Change Data Feed do Delta Lake.


Reginaldo Silva
8 de mai. de 20236 min de leitura
Databricks - Count(*) vs Count(1)? Como um Count em 100 Bilhões roda em menos de 1 segundo?
Já ouviu a lenda do COUNT(*) vs COUNT(1)? Nesse post vamos ir no deep dive.


Reginaldo Silva
6 de fev. de 20234 min de leitura
Databricks - Da para reduzir custos com paralelismo?
Paralelismo é um recurso muito importante para a computação, se bem aplicado pode trazer muitos benefÃcios, mas e para o mundo dos dados?

Reginaldo Silva
28 de jan. de 20235 min de leitura
Otimize seu Delta Lake e reduza custos (Storage, Databricks e computação)
Otimize seu Delta Lake e reduza custos com essa função disponibilizada para dar manutenção em suas tabelas.
bottom of page