Программа имеет смысл если в документе вообще есть текстовый слой.
Что вовсе необязательно. Современные методы "защиты от раздевания" уже не применяют встроенных в акробат возможностей, а используют более изощрённые способы.
Извлекаешь из PDF простой текст. Находишь какой-нибудь контент-анализатор и пропускаешь через него текст. Если не находишь, то пишешь сам. Если не умеешь, т о заказываешь на фрилансе или контент-анализатор или услугу по выявлению уникальных слов из своего текста.
что значит "уникальных"? так чтоб словарная форма была? всяко кто-то для себя подобное делал... типа поиска по файлам... но станет ли человек вам такое давать готовое и нахаляву?