Извлекаешь из PDF простой текст. Находишь какой-нибудь контент-анализатор и пропускаешь через него текст. Если не находишь, то пишешь сам. Если не умеешь, т о заказываешь на фрилансе или контент-анализатор или услугу по выявлению уникальных слов из своего текста.