PDF を画像に変換する

2019年10月15日

はじめに

Python を使って PDF を画像に変換する。

環境

  • Windows 10
  • Anaconda3 (Python 3.7)

Poppler/pdf2image をインストールする

PDF を画像に変換するために Poppler を入れる。

そのままでは日本語を認識してくれないので、言語データを入れる。

Poppler を "C:\poppler-0.68.0" にインストールしたとすれば、データを "C:\poppler-0.68.0\share" に "poppler" という名前で入れる。

続いて、pdf2image を入れる。

>pip install pdf2image

PDF を画像に変換する

from pdf2image import convert_from_path

images = convert_from_path("file.pdf")

i = 0
for image in images:
    image.save("%d.png" % i)
    i += 1

1ページ1画像で出力される。