// PDF FORENSICS

PDF Metadata Cleaner

Remove author, software, timestamps, and other hidden traces from PDF files — locally in your browser

Drop your PDF here

or click to browse

Max 50 MB. Processed entirely in your browser.

Metadados escondidos no seu PDF

Todo PDF carrega um dicionário "Info" que a maioria das pessoas nunca vê. Campos comuns incluem o Autor (geralmente o nome de utilizador do sistema operativo), o Criador (Word, LibreOffice, etc.), o Produtor (a biblioteca PDF), e datas exactas de criação e modificação. Para muitos documentos isto é inofensivo; para um currículo, uma submissão judicial, ou um documento "anónimo", pode ser uma divulgação crítica.

O que esta ferramenta faz

O seu PDF é lido na memória do navegador usando pdf-lib. O dicionário Info é enumerado e exibido. Ao descarregar, geramos um novo ficheiro PDF com os campos selecionados limpos. O ficheiro original no seu disco fica intacto. Nada é enviado para servidores.

O que NÃO faz

Não remove metadados XMP embutidos em object streams. A especificação do PDF tem dois sistemas paralelos de metadados: o dicionário Info (que limpamos) e, para a maioria dos ficheiros, é o mais ruidoso, e o dicionário XMP.
Não remove conteúdo de texto, imagens ou comentários. Se a sua preocupação é texto oculto ou histórico de revisões, precisa de uma ferramenta mais agressiva.
Invalida assinaturas digitais. Qualquer modificação aos bytes invalida a assinatura.

Mantenha sempre os dois ficheiros (original e versão limpa) até confirmar que nada essencial se perdeu.

O que não pode ser limpo (e porquê)

Alguns campos de metadados não podem ser removidos — só substituídos. Isto não é uma escolha nossa, é um limite da biblioteca PDF que utilizamos. Vale a pena perceber o que se passa:

Produtor (a assinatura da biblioteca PDF). Todo o PDF carrega um campo /Producer que nomeia o software que escreveu os bytes finais. Usamos uma biblioteca JavaScript chamada pdf-lib para ler o ficheiro e escrever a cópia limpa. Quando o pdf-lib guarda um PDF, carimba o próprio nome — pdf-lib (https://github.com/Hopding/pdf-lib) — no Produtor, sobrescrevendo o que estava lá. Não existe API pública para suprimir isto. Cirurgia byte-a-byte no resultado para apagar o Produtor arriscaria corromper PDFs que usam funcionalidades modernas de compressão (Object Streams), e a corrupção silenciosa é pior do que uma assinatura genérica. A fuga é pequena: ver "pdf-lib" diz que o ficheiro passou por uma biblioteca de código aberto; não o identifica, nem ao seu computador, nem ao histórico real do documento.

Data de criação e data de modificação. A especificação do PDF permite que estas datas estejam ausentes, mas o pdf-lib não produz um PDF sem elas — e mesmo que pudéssemos removê-las, a ausência em si é um sinal ("este ficheiro teve as datas removidas"). O caminho honesto é substituí-las por algo que não seja a sua data real. A ferramenta oferece duas estratégias:

1 de janeiro do ano original (predefinição). Mantém o ano do documento original e zera mês, dia e hora. Plausível — um PDF "de 2024" não levanta suspeita. Perde o detalhe ao nível do dia que um investigador poderia cruzar com outros acontecimentos.
1970-01-01 (Unix epoch). Totalmente neutro, mas cria um padrão reconhecível: quem analisar o ficheiro vai saber que passou por uma ferramenta de limpeza. Use quando preferir sinalizar "limpo" a revelar qualquer coisa específica.

Boa prática: mantenha os dois ficheiros

Descarregamos a versão limpa como seudocumento-limpo.pdf. O original permanece na sua máquina. Crie o hábito de guardar ambos, pelo menos temporariamente — se descobrir que a versão limpa estragou algo de que precisava (uma assinatura, os metadados de um campo de formulário), pode sempre voltar ao original.

Last reviewed July 2026