Black Friday Checklist

Image: Infra as Code

Hoje é dia 29/11/24, última sexta feira de Novembro, oficialmente o dia da Black Friday no e-commerce brasileiro. Para quem trabalha com infraestruturas para produtos/aplicativos/sites na internet hoje é um dia especial, hoje é o dia de colocar à prova o trabalho feito nos últimos meses.

Quando eu digo colocar à prova não é no sentido figurado não, é realmente um dos testes mais importantes, os e-commerces passam o ano todo esperando pelo faturamento de Novembro em especial pelo faturamento do dia de hoje. Para vocês terem uma ideia, o desempenho do dia de hoje define se algumas empresas vão aumentar ou diminuir sua fatia de mercado no pós Black Friday. Com o grande volume de vendas, os sistemas precisam funciona bem, muito bem!!!

No passado não muito distante, eu trabalhei num grande e-commerce brasileiro, e a nossa infraestrutura era toda baseada em componentes DataCenters sem cloud, isso não era problema nenhum as coisas funcionam da mesma forma que hoje, a gente só não tinha algumas facilidades que hoje as clouds já entregam por padrão, por exemplo as inúmeras formas de auto-scale que existem hoje para diversos componentes, daria para dizer que naquela época, a gente dirigia uma infra de câmbio manual e hoje a infra tem câmbio automático. Só para vocês terem uma ideia, a gente construía a escalabilidade de alguns componentes 😉, com a ajuda de automação e scripts o nosso autoscale se chamava carinhosamente de cagamaquinas.sh. #saudades #timeB (entendedores entenderam 😀 )

Talvez não dê tempo para hoje, torço para que você consiga revisar ainda hoje de manhã, mas pode servir para as próximas, segue o checklist que a gente fazia, que se aplica até hoje em infraestruturas com “câmbio automático”:

  1. Escalabilidade e Elasticidade

    • Revise as regras de auto-scaling em serviços como Kubernetes (HPA/VPA) ou infras que utilizem instâncias de VM, garantindo que a aplicação possa lidar com picos de tráfego. Scale UP e DOWN.
    • Valide os mecanismos de distribuição de cargas
    • Valide o limite de recursos (CPU, memória, IOPS) configurados nos serviços.
    • Veja o consumo de memória das JVMs.
  2. Testes de Carga e Estresse

    • Realize testes de carga, Stress Test, Load Test, Doble Spike test, Endurance testing simulando o tráfego esperado e o dobro do esperado
    • Execute testes de estresse para avaliar os limites dos componentes da infraestrutura e dos parceiros para identificar gargalos.
  3. Balanceamento de Carga e Redundância

    • Revise a configuração dos load balancers e componentes equivalentes para garantir a distribuição eficiente de tráfego.
    • Garanta que os servidores e serviços críticos estejam configurados com alta disponibilidade.
  4. Banco de Dados

    • Verifique o desempenho do banco de dados, ajustando índices, caches e otimizando slow queries, fazendo particionamento de tabelas.
    • Revise a capacidade de escalabilidade horizontal/vertical e habilitar réplicas para leitura.
  5. CDN e Cache

    • Valide que a CDN está configurada corretamente para entregar conteúdo estático.
    • Revise os tempos de expiração de objetos
    • Revise os tempos de expiração de chaves nos cache de aplicações
    • Revise o algoritmo de expiração de objetos
    • Ajuste políticas de cache para páginas e APIs com alto acesso.
  6. Observabilidade e Monitoramento

    • Configure dashboards específicos para monitorar métricas críticas durante o evento (tráfego, erros, latência, saturação) The Four Golden Signals.
    • Definir alertas proativos em ferramentas de Observabilidade para identificar problemas rapidamente.
    • Garanta o funcionamento correto do seu APM, trace

Resumo

Espero que ainda dê tempo de fazer tudo isso. Se a sua uma infra tem câmbio manual ou tem câmbio automático, isso não importa, desconfie de tudo, teste tudo, entenda tudo nos mínimos detalhes, teste, teste, teste tudo, a cloud não faz uma aplicação ser boa, o Data Center não faz uma aplicação ser ruim. Os seus testes que vão fazer as coisas funcionarem bem. Parafraseando um trecho do filme Top Gun Maverick, uma certa hora do filme o herói diz “It’s not the plane, it’s the pilot” eu ajusto a frase para “Não é a infra, é o engenheiro”. Boa sorte aaaêê jovens!!!!

Abraços!

Vida longa e próspera a todos!!

Referências

MENTORIA

Curtiu o blog? Quer trocar uma ideia comigo sobre algum post?

Marca Aqui! É um papo gratuito oferecido para quem é leitor do blog, podemos falar de temas como: DevOps, SRE e carreira em TI.


Te convido a ver os outros posts do blog Infra-as-Code garanto que tem coisas legais lá!!


--- --- IMPORTANTE --- ---
As opiniões aqui expressas são pessoais e de responsabilidade única e exclusiva do autor, elas não refletem necessariamente a posição das empresas que eu trabalho(ei) e/ou presto(ei) serviço.