// PDF FORENSICS

PDF Metadata Cleaner

Remove author, software, timestamps, and other hidden traces from PDF files — locally in your browser

Drop your PDF here

or click to browse

Max 50 MB. Processed entirely in your browser.

Какие метаданные прячутся в вашем PDF?

Каждый PDF-документ несёт небольшой словарь метаданных «Info», который большинство людей никогда не видит. Это не видимое содержимое документа — это данные *о* документе. Распространённые поля:

Для многих документов это безвредно. Для журналиста, получающего «анонимную» утечку, HR-заявку с «другого» ноутбука или судебную подачу — это может быть критическим раскрытием.

Что фактически делает этот инструмент

Ваш PDF загружается в память браузера через pdf-lib, JavaScript PDF-библиотеку. Словарь Info перечисляется, показывается вам, и при загрузке мы генерируем новый PDF-файл с удалёнными полями. Оригинальный файл на вашем диске остаётся нетронутым.

Мы никогда ничего не загружаем. Всю работу выполняет вкладка браузера. Вы можете убедиться в этом сами: откройте DevTools → вкладку Network, выполните очистку и наблюдайте — никаких исходящих запросов.

Что этот инструмент НЕ делает

Всегда сохраняйте оба файла (оригинал и очищенную версию), пока не подтвердите, что ничего существенного не было потеряно.

Что нельзя очистить (и почему)

Некоторые поля метаданных нельзя удалить — только заменить. Это не наш выбор, а ограничение PDF-библиотеки, которую мы используем. Стоит понимать, что происходит:

Producer (подпись PDF-библиотеки). Каждый PDF несёт запись /Producer, называющую программу, которая записала финальные байты. Мы используем JavaScript-библиотеку pdf-lib, чтобы прочитать ваш файл и записать очищенную копию. Когда pdf-lib сохраняет PDF, она штампует своё имя — pdf-lib (https://github.com/Hopding/pdf-lib) — в Producer, перезаписывая то, что было раньше. Публичного API для подавления этого нет. Хирургия на уровне байтов в выводе для стирания Producer рисковала бы повреждением PDF, использующих современные функции сжатия (Object Streams), а тихое повреждение хуже общей подписи. Утечка небольшая: видя "pdf-lib", кто-то понимает, что файл прошёл через open-source библиотеку; это не идентифицирует ни вас, ни ваш компьютер, ни реальную историю документа.

Дата создания и дата изменения. Спецификация PDF позволяет их отсутствие, но pdf-lib не выпустит PDF без них — и даже если бы мы могли их удалить, само отсутствие является сигналом ("у этого файла удалили даты"). Честный путь — заменить их чем-то, что не является вашей реальной меткой времени. Инструмент предлагает две стратегии:

Лучшая практика: сохраняйте оба файла

Очищенную версию мы скачиваем как yourdocument-clean.pdf. Оригинал остаётся на вашем устройстве. Возьмите за привычку хранить оба файла, хотя бы временно — если вы обнаружите, что очищенная версия что-то сломала (подпись, метаданные поля формы), вы всегда сможете вернуться к исходнику.