// PDF FORENSICS

PDF Metadata Cleaner

Remove author, software, timestamps, and other hidden traces from PDF files — locally in your browser

Drop your PDF here

or click to browse

Max 50 MB. Processed entirely in your browser.

Metadados escondidos no seu PDF

Todo PDF carrega um dicionário "Info" que a maioria das pessoas nunca vê. Campos comuns incluem o Autor (geralmente o nome de utilizador do sistema operativo), o Criador (Word, LibreOffice, etc.), o Produtor (a biblioteca PDF), e datas exactas de criação e modificação. Para muitos documentos isto é inofensivo; para um currículo, uma submissão judicial, ou um documento "anónimo", pode ser uma divulgação crítica.

O que esta ferramenta faz

O seu PDF é lido na memória do navegador usando pdf-lib. O dicionário Info é enumerado e exibido. Ao descarregar, geramos um novo ficheiro PDF com os campos selecionados limpos. O ficheiro original no seu disco fica intacto. Nada é enviado para servidores.

O que NÃO faz

Mantenha sempre os dois ficheiros (original e versão limpa) até confirmar que nada essencial se perdeu.

O que não pode ser limpo (e porquê)

Alguns campos de metadados não podem ser removidos — só substituídos. Isto não é uma escolha nossa, é um limite da biblioteca PDF que utilizamos. Vale a pena perceber o que se passa:

Produtor (a assinatura da biblioteca PDF). Todo o PDF carrega um campo /Producer que nomeia o software que escreveu os bytes finais. Usamos uma biblioteca JavaScript chamada pdf-lib para ler o ficheiro e escrever a cópia limpa. Quando o pdf-lib guarda um PDF, carimba o próprio nome — pdf-lib (https://github.com/Hopding/pdf-lib) — no Produtor, sobrescrevendo o que estava lá. Não existe API pública para suprimir isto. Cirurgia byte-a-byte no resultado para apagar o Produtor arriscaria corromper PDFs que usam funcionalidades modernas de compressão (Object Streams), e a corrupção silenciosa é pior do que uma assinatura genérica. A fuga é pequena: ver "pdf-lib" diz que o ficheiro passou por uma biblioteca de código aberto; não o identifica, nem ao seu computador, nem ao histórico real do documento.

Data de criação e data de modificação. A especificação do PDF permite que estas datas estejam ausentes, mas o pdf-lib não produz um PDF sem elas — e mesmo que pudéssemos removê-las, a ausência em si é um sinal ("este ficheiro teve as datas removidas"). O caminho honesto é substituí-las por algo que não seja a sua data real. A ferramenta oferece duas estratégias:

Boa prática: mantenha os dois ficheiros

Descarregamos a versão limpa como seudocumento-limpo.pdf. O original permanece na sua máquina. Crie o hábito de guardar ambos, pelo menos temporariamente — se descobrir que a versão limpa estragou algo de que precisava (uma assinatura, os metadados de um campo de formulário), pode sempre voltar ao original.