linux下如何将pdf转换成text文本

 时间:2024-10-15 00:43:54

1、安装软件sudo apt-get install gocrsudo apt-get install tesseract-ocr

2、打开Screenshot截屏软件截取你要转换的文字

linux下如何将pdf转换成text文本linux下如何将pdf转换成text文本

3、打开libreOffice Writer,将刚才截屏的图片托进去.

linux下如何将pdf转换成text文本

4、点击保存为PDF格式文件,文件名为text

linux下如何将pdf转换成text文本

5、找到保存好的text.pdf文件,右键打开终端.

linux下如何将pdf转换成text文本

6、在终端中输入pdftoppm text.pdf a,得到a-1.ppm文件

linux下如何将pdf转换成text文本

7、然后输入命令:tesseract a-1.ppm a,得到a.txt文件.

linux下如何将pdf转换成text文本
  • 怎么对图片局部区域进行文字识别
  • HTML表单教程 文件域的详解
  • loadrunner如何设置“Run-Time Setting”
  • VS Code中怎么替换项目中所有的相关字符串
  • C# NPOI操作excel列宽设置演示
  • 热门搜索
    微信零钱明细怎么删除 新鲜鱿鱼怎么做好吃 奇迹弓箭手怎么加点 美的净水器怎么样 去雀斑方法 肾积水的治疗方法 dota2怎么暂停 疱疹的治疗方法 想家怎么办 欠钱不还怎么办最有效的方法