PDF Metadata Cleaner
Remove author, software, timestamps, and other hidden traces from PDF files — locally in your browser
Drop your PDF here
or click to browse
Max 50 MB. Processed entirely in your browser.
We NEVER overwrite your original PDF. The clean version is generated as a separate file.
Removing or modifying metadata invalidates any digital signature on the PDF. If signature integrity matters for your use case (legal documents, signed contracts, notarized files), use the original — not the cleaned version.
No removable metadata fields found.
Metadados escondidos no seu PDF
Todo PDF carrega um dicionário "Info" que a maioria das pessoas nunca vê. Campos comuns incluem o Autor (geralmente o nome de utilizador do sistema operativo), o Criador (Word, LibreOffice, etc.), o Produtor (a biblioteca PDF), e datas exactas de criação e modificação. Para muitos documentos isto é inofensivo; para um currículo, uma submissão judicial, ou um documento "anónimo", pode ser uma divulgação crítica.
O que esta ferramenta faz
O seu PDF é lido na memória do navegador usando pdf-lib. O dicionário Info é enumerado e exibido. Ao descarregar, geramos um novo ficheiro PDF com os campos selecionados limpos. O ficheiro original no seu disco fica intacto. Nada é enviado para servidores.
O que NÃO faz
- Não remove metadados XMP embutidos em object streams. A especificação do PDF tem dois sistemas paralelos de metadados: o dicionário Info (que limpamos) e, para a maioria dos ficheiros, é o mais ruidoso, e o dicionário XMP.
- Não remove conteúdo de texto, imagens ou comentários. Se a sua preocupação é texto oculto ou histórico de revisões, precisa de uma ferramenta mais agressiva.
- Invalida assinaturas digitais. Qualquer modificação aos bytes invalida a assinatura.
Mantenha sempre os dois ficheiros (original e versão limpa) até confirmar que nada essencial se perdeu.
O que não pode ser limpo (e porquê)
Alguns campos de metadados não podem ser removidos — só substituídos. Isto não é uma escolha nossa, é um limite da biblioteca PDF que utilizamos. Vale a pena perceber o que se passa:
Produtor (a assinatura da biblioteca PDF). Todo o PDF carrega um campo /Producer que nomeia o software que escreveu os bytes finais. Usamos uma biblioteca JavaScript chamada pdf-lib para ler o ficheiro e escrever a cópia limpa. Quando o pdf-lib guarda um PDF, carimba o próprio nome — pdf-lib (https://github.com/Hopding/pdf-lib) — no Produtor, sobrescrevendo o que estava lá. Não existe API pública para suprimir isto. Cirurgia byte-a-byte no resultado para apagar o Produtor arriscaria corromper PDFs que usam funcionalidades modernas de compressão (Object Streams), e a corrupção silenciosa é pior do que uma assinatura genérica. A fuga é pequena: ver "pdf-lib" diz que o ficheiro passou por uma biblioteca de código aberto; não o identifica, nem ao seu computador, nem ao histórico real do documento.
Data de criação e data de modificação. A especificação do PDF permite que estas datas estejam ausentes, mas o pdf-lib não produz um PDF sem elas — e mesmo que pudéssemos removê-las, a ausência em si é um sinal ("este ficheiro teve as datas removidas"). O caminho honesto é substituí-las por algo que não seja a sua data real. A ferramenta oferece duas estratégias:
- 1 de janeiro do ano original (predefinição). Mantém o ano do documento original e zera mês, dia e hora. Plausível — um PDF "de 2024" não levanta suspeita. Perde o detalhe ao nível do dia que um investigador poderia cruzar com outros acontecimentos.
- 1970-01-01 (Unix epoch). Totalmente neutro, mas cria um padrão reconhecível: quem analisar o ficheiro vai saber que passou por uma ferramenta de limpeza. Use quando preferir sinalizar "limpo" a revelar qualquer coisa específica.
Boa prática: mantenha os dois ficheiros
Descarregamos a versão limpa como seudocumento-limpo.pdf. O original permanece na sua máquina. Crie o hábito de guardar ambos, pelo menos temporariamente — se descobrir que a versão limpa estragou algo de que precisava (uma assinatura, os metadados de um campo de formulário), pode sempre voltar ao original.