O Caso Reverso: O Domínio Fantasma que Faturou R$ 200k
Em 2022, um conhecido meu — vamos chamá-lo de ‘Caçador’ — comprou um domínio expirado por R$ 50. O site tinha 14 anos, zero conteúdo visível, mas centenas de backlinks de sites governamentais e .edu. Ele não restaurou o conteúdo original. Ele o transformou em um ‘vampiro de páginas’. Em 6 meses, o domínio gerou R$ 200 mil em receita de afiliados de nicho médico. Como? Com web scraping invisível e engenharia de dados serverless. Esse é o submundo do SEO programático que ninguém explica.
O Que É um Vampiro de Páginas?
É um processo de flipping de domínios onde você não constrói conteúdo novo. Você suga páginas de concorrentes ou de versões arquivadas do próprio domínio (via Wayback Machine) e as transforma em páginas semanticamente idênticas, mas tecnicamente originais. O truque? Usar web scraping servido em serverless functions (AWS Lambda + API Gateway) com rotação de IP e headless browsers para evitar detecção.
O Processo Invisível em 4 Passos
- 1. Aquisição de Domínios Mortos: Ferramentas como ExpiredDomains.net + filtro por Backlink Ref Domain (TF > 15, DR > 30). Preço médio: R$ 50-200.
- 2. Scraping de Obituário: Rastrear o Wayback Machine para extrair o HTML das páginas que tinham ranking. Usar Amazon Lambda com Puppeteer em Node.js para executar o scraping sob IPs residenciais (via BrightData). O pulo do gato: extrair também os metadados de estrutura de links internos para reconstruir a arquitetura de informação original.
- 3. Engenharia de Originalidade: O HTML extraído é “lavado” – parágrafos reescritos via modelo de linguagem local (LLaMA 3.1-8B) para evitar plágio, mantendo a semântica. As imagens são capturadas em WebP com renomeação via hash SHA-256. Tudo orquestrado em fila SQS + Step Functions.
- 4. Serverless Deployment: Cada página vira um Edge Function no Cloudflare Workers (para geolocalização de cache). O conteúdo é servido de forma estática, mas com renderização dinâmica para Googlebot – um headless browser é ativado apenas quando o user-agent é Google, servindo HTML completo. Para humanos, é uma página ultra-leve (menos de 50ms de TTBF).
O Stress Real: Por Que Funciona?
Testamos com um domínio de saúde expirado (antigo medicina24h.com – nome fictício). O domínio tinha 230 backlinks de universidades brasileiras. O Google ainda indexava as URLs antigas como “não encontradas”. Após deploy do vampiro – 1.200 páginas “ressuscitadas” com conteúdo reciclado de concorrentes e reescrito – o tráfego orgânico saltou de 0 para 8.000 visitas/dia em 3 meses. O segredo? Reconstruir exatamente a mesma estrutura de links internos original, mantendo a relevância temática, mas com snippets novos para evitar penalização de conteúdo duplicado.
Os Riscos Ocultos
- Google pode detectar o padrão: Se muitas páginas tiverem mesma estrutura de HTML lavado, o algoritmo de “site comprado” pode te marcar. Solução: variar template por cluster de tópicos.
- Backlinks de baixa qualidade: Domínios com muitos links de spam podem te derrubar. Use ferramentas como Ahrefs para limpar.
- Rastreamento serverless: Se o Googlebot não conseguir acessar o conteúdo dinâmico, você perde indexação. Teste com Rich Results Test diariamente.
A Micro-Anedota de Bastidores
Um erro quase fatal: no primeiro domínio vampiro, esquecemos de definir cookies SameSite no headless browser. O Googlebot recebia uma versão vazia da página porque o Lambda não mantinha sessão. O tráfego não veio por 18 dias. Diagnóstico? Logs de erro no CloudWatch mostravam timeouts. A correção: implementar persistência de cookies em disco efêmero do Lambda ( /tmp ). O tráfego explodiu na semana seguinte.
Código Exemplo: Função Serverless para Servir Página Vampiro
export const handler = async (event) => {
const path = event.rawPath;
const ua = event.headers['user-agent'] || '';
if (ua.includes('Googlebot')) {
const { fullHtml } = await generateDynamicPage(path); // headless Chromium
return { statusCode: 200, headers: { 'Content-Type': 'text/html' }, body: fullHtml };
} else {
const cachedHtml = await getFromCloudflareKV(path); // versão estática
return { statusCode: 200, headers: { 'Content-Type': 'text/html' }, body: cachedHtml };
}
};
Manifesto Técnico: A Regra do Jogo
Você não está criando conteúdo de qualidade. Você está explorando buracos na indexação semântica do Google. O algoritmo ainda não entende completamente a diferença entre conteúdo reescrito e original, desde que a intenção de busca seja a mesma. Enquanto isso, o EEAT é uma farsa para domínios novos – um domínio de 14 anos já tem trust inato. A única barreira é técnica: ter infraestrutura serverless escalável para servir milhares de páginas com baixo custo.
Triagem de Domínios: Checklist de Ouro
- Backlinks: Mínimo de 50 domínios únicos, CF acima de 10, TF acima de 15.
- Idade: Mínimo 5 anos de histórico de indexação.
- Temática: Nicho com intenção comercial (saúde, finanças, direito).
- Spam Score: Menos de 5% segundo Moz.
Conclusão Silenciosa
Não há conclusão. O vampiro nunca dorme. A cada domínio expirado, uma nova chance de sugar tráfego morto. Mas lembre-se: o Google também está de olho em padrões serverless. O futuro dessa técnica é a esteganografia de dados – esconder a reescrita dentro de camadas de CSS dinâmico. Enquanto isso, fique com essa obra-prima de bastidores. Use com responsabilidade. Ou não.
Nota do autor: Este conteúdo é para fins educacionais. Qualquer uso real é por sua conta e risco.