// PDF FORENSICS

PDF Metadata Cleaner

Remove author, software, timestamps, and other hidden traces from PDF files — locally in your browser

Drop your PDF here

or click to browse

Max 50 MB. Processed entirely in your browser.

Jakie metadane kryją się w twoim PDF?

Każdy dokument PDF zawiera mały słownik metadanych "Info", którego większość ludzi nigdy nie widzi. Typowe pola:

W przypadku wielu dokumentów jest to nieszkodliwe. Dla dziennikarza otrzymującego "anonimowy" przeciek, podania HR z "innego" laptopa lub złożenia sądowego, może to być krytyczne ujawnienie.

Co właściwie robi to narzędzie

Twój PDF jest ładowany do pamięci przeglądarki za pomocą pdf-lib, biblioteki PDF JavaScript. Słownik Info jest wyliczany, pokazywany tobie, a przy pobieraniu generujemy nowy plik PDF z usuniętymi polami. Oryginalny plik na twoim dysku pozostaje nietknięty.

Nigdy nic nie przesyłamy. Karta przeglądarki wykonuje całą pracę.

Czego to narzędzie NIE robi

Zawsze zachowuj oba pliki (oryginał i wersję wyczyszczoną), dopóki nie potwierdzisz, że nic istotnego nie zostało utracone.

Czego nie da się wyczyścić (i dlaczego)

Niektóre pola metadanych nie mogą być usunięte — tylko zastąpione. To nie nasza decyzja, to ograniczenie biblioteki PDF, której używamy. Warto wiedzieć, co się dzieje:

Producer (sygnatura biblioteki PDF). Każdy PDF ma pole /Producer nazywające oprogramowanie, które zapisało końcowe bajty. Używamy biblioteki JavaScript zwanej pdf-lib, aby przeczytać Twój plik i zapisać czystą kopię. Kiedy pdf-lib zapisuje PDF, stempluje własną nazwę — pdf-lib (https://github.com/Hopding/pdf-lib) — w polu Producer, nadpisując to, co było tam wcześniej. Nie ma publicznego API, aby to wyłączyć. Operacja na poziomie bajtów na wyjściu, aby usunąć Producer, ryzykowałaby uszkodzeniem PDF-ów używających nowoczesnych funkcji kompresji (Object Streams), a ciche uszkodzenie jest gorsze niż ogólna sygnatura. Wyciek jest niewielki: widząc "pdf-lib" ktoś wie, że plik przeszedł przez bibliotekę open-source; nie identyfikuje to Ciebie, Twojego komputera ani prawdziwej historii dokumentu.

Data utworzenia i data modyfikacji. Specyfikacja PDF pozwala na ich nieobecność, ale pdf-lib nie wyprodukuje PDF bez nich — a nawet gdybyśmy mogli je usunąć, sama nieobecność jest sygnałem ("ten plik miał usunięte daty"). Uczciwą drogą jest zastąpienie ich czymś, co nie jest Twoim prawdziwym znacznikiem czasu. Narzędzie oferuje dwie strategie:

Dobra praktyka: zachowaj oba pliki

Wyczyszczoną wersję pobieramy jako twojdokument-czysty.pdf. Oryginał pozostaje na twoim urządzeniu. Wyrób sobie nawyk przechowywania obu, przynajmniej tymczasowo — jeśli odkryjesz, że wyczyszczona wersja zepsuła coś, czego potrzebowałeś (podpis, metadane pola formularza), zawsze możesz wrócić do oryginału.