2022-11-07 11:45

PDF文件转换成word文档--PDF文件转换成图片

码自答

Python

(429)

(0)

收藏

  • PDF文件转word

    • 安装pdf2docx模块

      pip install pdf2docx

    • 代码

    • from pdf2docx import Converter
      #导入pdf2docx包的Converter类
      
      def pdf2word(file_path):
          doc_file = "c:/test/test.docx"
          #word文档的文件路径和文件名
      
          conveter = Converter(file_path)
          #创建Converter对象 打开pdf文件
      
          conveter.convert(doc_file)
          #转换pdf文件
      
          conveter.close()
      
      pdf2word("c:/test/2.pdf")
  • PDF文件转图片

    • 安装pymupdf模块

      pip install pymupdf==1.18

            安装1.18版

    • 代码

    • import fitz
      #pip install pymupdf==1.18
      
      doc = fitz.open("c:/test/1.pdf")
      #打开pdf文件  生成doc对象
      
      #doc.pageCount pdf文件的总页数
      #range(doc.pageCount) 根据pdf文件的总页数 生成序列
      for pg in range(doc.pageCount):
          page = doc[pg]
          #pg页码  从pdf文件中间取一页
      
          trans = fitz.Matrix(2,2).preRotate(0)
          #2,2分别是x和y方向的缩放  
      
          pm = page.getPixmap(matrix=trans,alpha=False)
          #从pdf取出的一页 生成一张图片
      
          pm.writePNG(f"c:/test/{pg}.png")
          #生成的图片  保存成为文件


0条评论

点击登录参与评论