top of page
Topo
Buscar


Databricks - 7 TB - 127 BILHÕES de linhas - Truncate table vs Delete?
Você sabe qual é mais performático, truncate table ou delete?
Reginaldo Silva
17 de jul. de 20233 min de leitura


DTSTOOLS - lastMaintenance - Descubra se sua tabela Delta tem rotina de manutenção
Quer saber se sua tabela Delta tem uma boa rotina de manutenção aplicada? Da uma conferida na DTSTOOLS.
Reginaldo Silva
10 de jul. de 20232 min de leitura


Databricks - English SDK + AI - É o fim dos engenheiros de dados?
Será que é o fim para os engenheiros de dados?
Reginaldo Silva
3 de jul. de 20236 min de leitura


Documentando seus notebooks - Parte 2 - As flores
Saiba como adicionar badges e desenhos na sua documentação.
Reginaldo Silva
25 de jun. de 20233 min de leitura


DTSTOOLS - Descubra o verdadeiro tamanho do seu Delta Lake
A DTSTOOLS é uma biblioteca para te ajudar com seu Delta Lake e reduzir custos de storage
Reginaldo Silva
19 de jun. de 20233 min de leitura


Delta Lake - Nunca mais leia Parquets
Nesse post eu explico o motivo pelo qual você não deve ler arquivos Parquet.
Reginaldo Silva
12 de jun. de 20234 min de leitura


Delta Lake - Time Travel vs Change Data Feed (CDF) - O que você precisa saber
Nesse post você irá conhecer as particularidades do Time Travel e o Change Data Feed do Delta Lake.
Reginaldo Silva
5 de jun. de 20239 min de leitura


Databricks - Delta Lake - Versões, Protocolos, Features, Upgrade e mais
Entenda mais sobre o comportamento e versões da sua tabela Delta.
Reginaldo Silva
29 de mai. de 20239 min de leitura


Databricks - Deletion Vectors - Otimizando seu Storage
Deletion Vector - Essa feature pode otimizar seu custo com Storage.
Reginaldo Silva
22 de mai. de 20235 min de leitura


Databricks - Documentando seus notebooks
Dicas para documentar seus notebooks like a boss.
Reginaldo Silva
15 de mai. de 20233 min de leitura


Databricks - Count(*) vs Count(1)? Como um Count em 100 Bilhões roda em menos de 1 segundo?
Já ouviu a lenda do COUNT(*) vs COUNT(1)? Nesse post vamos ir no deep dive.
Reginaldo Silva
8 de mai. de 20236 min de leitura


Databricks - 4 dicas de como parametrizar seu Notebook para rodar em diferentes ambientes(Dev\Prod)
Dicas de como parametrizar seus notebooks para rodarem em diferentes ambientes, como DEV e PROD.
Reginaldo Silva
3 de mai. de 20233 min de leitura


Databricks - TablesSize&Vacuum - Monitore e reduza custos do seu Delta lake
Você possui rotina de manutenção no seu Delta Lake? Essa rotina pode diminuir seus custos com storage e te dar um monitoramento proativo.
Reginaldo Silva
23 de abr. de 20237 min de leitura


Backup de Data Lake, isso existe? Salvando vidas e empregos
Já ouviu falar em Backup de Data Lake? De fato, esse tema não é tão falado assim, mas existem maneiras de se proteger contra incidentes.
Reginaldo Silva
16 de abr. de 20239 min de leitura


Databricks - Certificações e por onde estudar?
Como estudar Databricks, por onde estudar, por qual curso começar?
Reginaldo Silva
10 de abr. de 202310 min de leitura


Databricks - Como identificar de qual arquivo veio um determinado registro?
Já precisou rastrear de qual arquivo veio um determinado registro? Neste post veremos como fazer isso.
Reginaldo Silva
2 de abr. de 20232 min de leitura


Databricks - Casos de suporte - Você sabe a diferença entre %run e dbutils.notebook.run()?
Você sabe a diferença entre o %run e o notebook.run()?
Reginaldo Silva
26 de mar. de 20234 min de leitura


Databricks - Spark Confs
Sabe como ver todas as Spark Confs no seu cluster Databricks?
Reginaldo Silva
20 de mar. de 20232 min de leitura


Databricks: Como funciona o Column Mapping (Rename e Drop columns)
Ja precisou renomear ou dropar uma coluna em uma tabela Delta? Vamos entender como isso funciona.
Reginaldo Silva
13 de mar. de 20233 min de leitura
![Databricks 0 a 100 - [3] - Clusters Configs - Parte 1 - Desmistificando Nomenclaturas](https://static.wixstatic.com/media/a794bc_d12a7b7283a24165920fa83b4a3b5dc5~mv2.png/v1/fill/w_333,h_250,fp_0.50_0.50,q_35,blur_30,enc_avif,quality_auto/a794bc_d12a7b7283a24165920fa83b4a3b5dc5~mv2.webp)
![Databricks 0 a 100 - [3] - Clusters Configs - Parte 1 - Desmistificando Nomenclaturas](https://static.wixstatic.com/media/a794bc_d12a7b7283a24165920fa83b4a3b5dc5~mv2.png/v1/fill/w_454,h_341,fp_0.50_0.50,q_95,enc_avif,quality_auto/a794bc_d12a7b7283a24165920fa83b4a3b5dc5~mv2.webp)
Databricks 0 a 100 - [3] - Clusters Configs - Parte 1 - Desmistificando Nomenclaturas
Ja precisou criar um cluster no Databricks e se deparou com uma séries de configurações que você não conhecia? Então veja esse vídeo.
Reginaldo Silva
8 de mar. de 20232 min de leitura
bottom of page

