焦点精选!Python一键实现PDF文档批量转Word
【资料图】
目录
实现效果环境准备代码实现无论是在工作还是学习当中,大家都会遇到这样一个问题,将“PDF当中的内容(文本和图片)转换为Word的格式”,也就是说从只读转换成可编辑的格式。网上绝大多数的工具也都是收费的,今天小编就给大家制作了一款批量将PDF
文件转换为Word
的神器,使用起来也是相当的方便。
实现效果
我们首先来看一下出来的效果,如下图所示
环境准备
用到的模块叫做pdf2docx
,我们通过pip
命令进行下载,如下
pip install pdf2docx
后续我们还可以为py
文件打包,用到的库是pyinstaller
pip install pyinstaller
代码实现
我们先简单地实现将单个PDF
文档转换成Word
文档,代码如下
from pdf2docx import Converter cv = Converter(r"pdf文件的路径") cv.convert("test.docx", start=0,end=None) cv.close()
那么上面的是单个PDF
文件,要是涉及到是多个PDF
文件,则需要用到遍历上传过来的每一个文件,用到for
循环遍历
def startAction(self): output_path_1 = Path.joinpath(Path.home(), "Desktop") output_path_2 = str(output_path_1) + "\\output" if not os.path.exists(output_path_2): os.mkdir(output_path_2) for path_list in pdfPath_list: print("路径: ", path_list) name = path_list.split("/")[-1].split(".")[0] cv = Converter(path_list) cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None) cv.close() msg_box = QMessageBox(QMessageBox.Information, "完成", "提取完成", QMessageBox.Yes) msg_box.exec_()
上述的代码,我们首先将指定好输出的Word
文档的位置,这里小编设置的是在桌面,然后通过for循环去遍历处理每一个PDF
文档,当所有的步骤都完成的时候,提示我们已经完成了。
当然整个可视化界面当中还有一个上传文件的功能,代码如下
# 选择本地文件上传 def uploadFiles(self): global pdfPath_list # 这里为了方便别的地方引用文件路径,将其设置为全局变量 pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上传文件", r"路径", "*.pdf;;All Files(*)") # 显示所选文件的路径 self.ui.lineEdit.setText(",".join(pdfPath_list))
整体的代码如下所示
from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog from PySide2.QtUiTools import QUiLoader from pdf2docx import Converter from pathlib import Path import os class OCRQt: def __init__(self): self.ui = QUiLoader().load("pdf2word.ui") self.ui.pushButton.clicked.connect(self.uploadFiles) self.ui.pushButton_2.clicked.connect(self.startAction) def uploadFiles(self): ........ ........ def startAction(self): ....... ....... if __name__ == "__main__": app = QApplication([]) # 显示创建的界面 MainWindow = OCRQt() # 创建窗体对象 MainWindow.ui.show() # 显示窗体 app.exit(app.exec_()) # 程序关闭时退出进程
到此这篇关于Python一键实现PDF文档批量转Word的文章就介绍到这了,更多相关Python PDF转Word内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
X 关闭
X 关闭
- 1联想拯救者Y70发布最新预告:售价2970元起 迄今最便宜的骁龙8+旗舰
- 2亚马逊开始大规模推广掌纹支付技术 顾客可使用“挥手付”结账
- 3现代和起亚上半年出口20万辆新能源汽车同比增长30.6%
- 4如何让居民5分钟使用到各种设施?沙特“线性城市”来了
- 5AMD实现连续8个季度的增长 季度营收首次突破60亿美元利润更是翻倍
- 6转转集团发布2022年二季度手机行情报告:二手市场“飘香”
- 7充电宝100Wh等于多少毫安?铁路旅客禁止、限制携带和托运物品目录
- 8好消息!京东与腾讯续签三年战略合作协议 加强技术创新与供应链服务
- 9名创优品拟通过香港IPO全球发售4100万股 全球发售所得款项有什么用处?
- 10亚马逊云科技成立量子网络中心致力解决量子计算领域的挑战