如果pdf虽然能选择到文字,但是复制出来的是乱码,则把它打印成pdf,再次识别。
记得用Adobe acrobat pro来识别,准确率最高。
如果pdf加密了,则用PDF Password Remover去除m密码后再操作。
用稻壳阅读器可以找到很多你想要的,然后打印成pdf,识别和优化即可。