--- name: TAP Capacity Audit 2026-05-11 description: TAP funcional OW+RT+multipax, dados completos. adv-23 chrome_down há 4 dias - capacidade pela metade. Restart precisa SSH manual. type: project originSessionId: 2599d295-29b1-43d3-93f7-6b44de3bf1d6 --- # TAP — Auditoria de Capacidade 11/05/2026 ## Estado infra (verificado em produção) | Componente | Status | Detalhes | |---|---|---| | `scraper-tap-milesgo` (id 15) | ONLINE | 73MB · 6D uptime · 53 restarts (deploys) · porta 3022 | | `proxy-bridge-tap` (id 49) | ONLINE | 107MB · 18D uptime | | `tap-cal-server` (id 53) | ONLINE | 87MB · 14D uptime (preços-dia complementares) | | Solver adv-22:9090 | ONLINE | Chrome up 3.5D · 27/28 sucesso · peakConcurrent=3 · cache 25 | | Solver adv-23:9090 | ⚠️ CHROME_DOWN | Last successful search 2026-05-07 (4 dias parado) · `/restart-chrome` retorna "Chrome CDP did not become ready in 30s" | | Gateway dedup `pendingSearches` | ATIVO | CACHE_TTL=60min | | Scraper `service.js` cache | 60min | linhas 15/376 | | Round-robin VM_HOSTS | `100.91.20.22,100.123.139.93` | + fallback automático (index.js:1639+) | | `TAP_PARALLEL_RT` | default ON | (index.js:384) | | VM `MAX_CONCURRENT` | 3 por VM (6 total se ambos UP) | atualmente apenas 3 (adv-22) | ## Smoke tests OW/RT/multipax (gateway :3001, rotas reais TAP) | Cenário | Tempo | Voos | Carriers | comPreço | |---|---|---|---|---| | OW GIG-LIS cold d+60 | 66s | 149 | TP102 G336 AD11 | 100% (R$ 4.853 - 20.807) | | OW GIG-LIS warm | **3.5s** | 149 | — | cache hit | | RT GIG-LIS cold d+60/+75 | 65s | 241 (149+92) | — | 100% (RT paralelo 2 VMs) | | OW CNF-LIS cold | 32s | 141 | — | 100% | | OW GRU-OPO cold | 64s | 198 | — | 100% | | OW 2A+1C GRU-LIS cold | 31s | 141 | — | 100% multi-pax | **Dados confirmados**: - 4-6 `tarifasDisponiveis[]` por voo (Basic/Classic/Plus/Top/Executive) - `preco.menorTarifa`, `preco.taxaEmbarque`, `valorTotalBRL`, `tarifasDisponiveis[].cabineNome/fareFamily/valor/bagagemInclusa/reembolsavel` - ⚠️ `preco.dinheiro` está null (campo legacy) — usar `preco.menorTarifa` ou `valorTotalBRL` ## Stress 10 paralelas únicas (cold, sem cache) - **10/10 sucesso (100%)** · todas com preço (141-181 voos cada) - avg=89s · p95=140s · max=140s · wallclock=140s ## Dedup 8 paralelas mesma cacheKey - **8/8 sucesso · todas em ~64.7s wallclock** (apenas 1 scrape real) - 224 voos, 100% comPreco ## Capacidade estimada para 5k usuários TAP é mais lenta que Smiles (Kasada + 100-200 voos por rota). Com 5000 usuários distribuídos: **Cenário atual (somente adv-22, 3 slots)**: | Pico simultâneo | cacheKeys distintas (cache 50%) | Tempo P95 | Avaliação | |---|---|---|---| | 30 | 15 | ~150s | ⚠️ aceitável | | 50 | 25 | ~250s | ❌ fila visível | | 100 | 50 | ~500s | ❌ degrada | **Cenário com adv-23 reativada (6 slots)**: | Pico simultâneo | cacheKeys distintas | Tempo P95 | Avaliação | |---|---|---|---| | 50 | 25 | ~125s | ✅ OK | | 100 | 50 | ~250s | ⚠️ borderline | | 150 | 75 | ~375s | ❌ degrada | ⚠️ **Conclusão**: Para 5k usuários, **precisa restartar adv-23**. Sem ela, pico > 30 simultâneos degrada. Com ambas: pico até 80 OK, picos > 100 viram fila. ## URGENTE — adv-23 Chrome Down há 4 dias ```bash # Última busca bem-sucedida: 2026-05-07 06:35 UTC # Endpoint restart falha: "Chrome CDP did not become ready in 30s" # Tailscale SSH gate exige auth Jesiel via web (URL gerada por sessão, expira). # Cada tentativa de SSH gera URL nova tipo: # https://login.tailscale.com/a/ # Port 22 → timeout até autorizar; port 2222 → connection refused (sshd nativo não escuta nessa porta na adv-23). # Passos para resolver (manual): # 0. PRIMEIRO: rodar SSH adv-23 (qualquer comando) pra capturar a URL atual de auth, e abri-la no browser logado como zieltelles@ # 1. SSH na adv-23: ssh customer@100.123.139.93 -p 22 # senha "Skymilhas26" # 2. Investigar logs: sudo journalctl -u tap-solver -n 100 --no-pager tail -100 /var/log/tap-solver.log # 3. Restart hard: sudo systemctl restart tap-solver sleep 15 curl http://127.0.0.1:9090/health # esperar chrome:true # 4. Se Chrome não subir, recriar profile: sudo systemctl stop tap-solver sudo rm -rf /home/customer/skymilhas-chrome-profile sudo systemctl start tap-solver ``` ## Recomendações para 5k usuários (sem mexer no scraper) 1. **Restartar adv-23 (urgente)** — duplica slots de 3 para 6 2. Avaliar elevar `MAX_CONCURRENT` 3→4 nas VMs (cuidado Kasada) 3. Pre-warm cron das top 10 rotas TAP a cada 50min 4. Adicionar adv-24 se pico > 150 simultâneos virar realidade ## Conclusão **TAP 100% funcional OW + RT + multi-pax**. Dados completos (preços, tarifas, fareFamilies, taxas, codeshare TP/G3/AD). Cache+dedup+RT paralelo OK. **Bloqueio operacional**: adv-23 chrome_down há 4 dias precisa intervenção manual. Em estado atual (1 VM ativa), aguenta cargas moderadas (até ~30 simultâneos). Com adv-23 reativada: tranquilo para 5k distribuídos. **Why:** Jesiel pediu verificação + capacidade pra 5k usuários TAP. **How to apply:** Reportar adv-23 down como blocker. Após restart, TAP escala bem.