PDF Metadata Cleaner
Remove author, software, timestamps, and other hidden traces from PDF files — locally in your browser
Drop your PDF here
or click to browse
Max 50 MB. Processed entirely in your browser.
We NEVER overwrite your original PDF. The clean version is generated as a separate file.
Removing or modifying metadata invalidates any digital signature on the PDF. If signature integrity matters for your use case (legal documents, signed contracts, notarized files), use the original — not the cleaned version.
No removable metadata fields found.
Какие метаданные прячутся в вашем PDF?
Каждый PDF-документ несёт небольшой словарь метаданных «Info», который большинство людей никогда не видит. Это не видимое содержимое документа — это данные *о* документе. Распространённые поля:
- Автор — обычно имя пользователя операционной системы того, кто создал файл. («Мария Иванова» на корпоративном ноутбуке или, что хуже: «mivanova», совпадающее с логином электронной почты.)
- Создатель — программа, которая изначально написала документ («Microsoft Word 2019», «LibreOffice 7.4», «Adobe Acrobat Pro DC»).
- Производитель — PDF-библиотека, которая сгенерировала конечный файл. Показывает, был ли он экспортирован, сконвертирован или напечатан в PDF.
- Дата создания и Дата изменения — точные временные метки, часто с точностью до секунды. Они могут раскрыть, когда вы это написали (в 3 часа ночи перед сдачей?) или что файл, который вы назвали неизменным, на самом деле редактировался вчера.
- Заголовок, Тема, Ключевые слова — автоматически устанавливаются некоторыми Office-шаблонами и часто содержат внутренние названия проектов.
Для многих документов это безвредно. Для журналиста, получающего «анонимную» утечку, HR-заявку с «другого» ноутбука или судебную подачу — это может быть критическим раскрытием.
Что фактически делает этот инструмент
Ваш PDF загружается в память браузера через pdf-lib, JavaScript PDF-библиотеку. Словарь Info перечисляется, показывается вам, и при загрузке мы генерируем новый PDF-файл с удалёнными полями. Оригинальный файл на вашем диске остаётся нетронутым.
Мы никогда ничего не загружаем. Всю работу выполняет вкладка браузера. Вы можете убедиться в этом сами: откройте DevTools → вкладку Network, выполните очистку и наблюдайте — никаких исходящих запросов.
Что этот инструмент НЕ делает
- Не удаляет метаданные XMP, встроенные в object streams. Спецификация PDF имеет две параллельные системы метаданных: словарь Info (который мы очищаем), который для большинства файлов является более «шумным», и словарь XMP.
- Не удаляет текстовое содержимое, изображения или комментарии. Для скрытого текста или истории ревизий используйте более агрессивный инструмент.
- Не сохраняет цифровые подписи. Любое изменение байтов файла делает их недействительными.
Всегда сохраняйте оба файла (оригинал и очищенную версию), пока не подтвердите, что ничего существенного не было потеряно.
Что нельзя очистить (и почему)
Некоторые поля метаданных нельзя удалить — только заменить. Это не наш выбор, а ограничение PDF-библиотеки, которую мы используем. Стоит понимать, что происходит:
Producer (подпись PDF-библиотеки). Каждый PDF несёт запись /Producer, называющую программу, которая записала финальные байты. Мы используем JavaScript-библиотеку pdf-lib, чтобы прочитать ваш файл и записать очищенную копию. Когда pdf-lib сохраняет PDF, она штампует своё имя — pdf-lib (https://github.com/Hopding/pdf-lib) — в Producer, перезаписывая то, что было раньше. Публичного API для подавления этого нет. Хирургия на уровне байтов в выводе для стирания Producer рисковала бы повреждением PDF, использующих современные функции сжатия (Object Streams), а тихое повреждение хуже общей подписи. Утечка небольшая: видя "pdf-lib", кто-то понимает, что файл прошёл через open-source библиотеку; это не идентифицирует ни вас, ни ваш компьютер, ни реальную историю документа.
Дата создания и дата изменения. Спецификация PDF позволяет их отсутствие, но pdf-lib не выпустит PDF без них — и даже если бы мы могли их удалить, само отсутствие является сигналом ("у этого файла удалили даты"). Честный путь — заменить их чем-то, что не является вашей реальной меткой времени. Инструмент предлагает две стратегии:
- 1 января оригинального года (по умолчанию). Сохраняет год оригинального документа и обнуляет месяц, день и время. Правдоподобно — PDF "от 2024 года" не выглядит подозрительно. Теряет детализацию по дню, которую следователь мог бы соотнести с другими событиями.
- 1970-01-01 (Unix epoch). Полностью нейтрально, но создаёт узнаваемый узор: любой, кто анализирует файл, будет знать, что он прошёл через инструмент очистки. Используйте, когда предпочитаете сигнализировать «очищено», чем раскрывать что-то конкретное.
Лучшая практика: сохраняйте оба файла
Очищенную версию мы скачиваем как yourdocument-clean.pdf. Оригинал остаётся на вашем устройстве. Возьмите за привычку хранить оба файла, хотя бы временно — если вы обнаружите, что очищенная версия что-то сломала (подпись, метаданные поля формы), вы всегда сможете вернуться к исходнику.