Ubuntu 16.04 安装 Adobe Reader

Ubuntu 16.04/16.10 安装 Adobe Reader:

Ubuntu 16.04 安装 Adobe Reader

使用PyMuPDF提取PDF文档中所有图片-Python

PyMuPDF是MuPDF的Python封装。

安装PyMuPDF和MuPDF,参考:https://github.com/rk700/PyMuPDF

提取PDF文档中所有图片,保存为PNG格式:

旋转pdf文档:

Ubuntu 安装使用 PDFsam

PDFsam可以拆分、 合并、 重排PDF文件的内容。你可以分割页面、 提取页面或书签、 将多个PDF文件合并成一个,旋转文档和交换文档之间的页面等等。

PDFsam即有收费版本,也有免费版本。

PDFsam Basic是开源免费版本,功能虽然没有收费版多,但是基本功能都有。

PDFsam Basic is our free and open source desktop application to split, merge, extract pages, rotate and mix PDF files

PDFsam Basic源代码:https://github.com/torakiki/pdfsam 继续阅读Ubuntu 安装使用 PDFsam

TPPDF-用来生成PDF的Swift库-iOS

TPPDF是一个用来创建PDF文件的Swift库,TPPDF源代码:https://github.com/Techprimate/TPPDF

取自Readme中的一段代码:

TPPDF支持页面大小、布局、表格、图像、页头和页脚等等。

使用Python进行OCR文字识别(识别PDF文字)

你也许听说过使用Python进行OCR(Optical Character Recognition)文字识别。关于OCR的库有很多,最著名的库是google赞助的tesseract。使用它在图像上执行OCR很简单,但是在PDF文档上执行OCR时,我遇到了不少问题。 继续阅读使用Python进行OCR文字识别(识别PDF文字)