就我自己使用的经历来看,如果PDF是那种可以复制的(比如使用WPS转化PDF软件转化来的PDF),那么文字是可以直接复制出来,应该不存在楼主的问题
所以我猜测应该是扫描件,或者原本是图片格式转化出来的,这样PDF中的文字内容是不能直接选定的(只能选定某一些区域)
这种情况下我建议使用CAJ软件,全名CAJViewer 7.0 这个软件的图片转化汉字效果不错,基本能够达到使用需求。
当然,这个也不是尽善尽美的,有3个重要要求,第一个是说文字尽量水平,达到一定倾斜角度后,转化后会出现乱码.
第二个是原字体最后是宋体等不连笔的字体,比如华文行楷一类的连笔字体,转化效果也很差
第3是文章中最好没英文,带着中英文一起转化会出现乱码
最后,CAJViewer 7.0里面的转化方式是用选择图像功能键 框选一部分汉字,然后选择识别文字,就可以得到完整的文字了,当然还是要校对一下