Spaces:

yakki233
/

lab

Sleeping

yakki233 commited on 25 days ago

Commit

37da1c2

verified ·

1 Parent(s): 52daeb6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -76,7 +76,8 @@ def pdf_to_images(pdf_bytes: bytes, dpi: int = 200) -> List[Image.Image]:
     for i in range(n_pages):
         page = pdf[i]
-        pil_image = page.render(scale=dpi / 72).to_pil()  # 72 dpi 是 PDF 默认分辨率
         images.append(pil_image)
     return images
@@ -112,7 +113,6 @@ def run_ocr(file: Union[bytes, None], image: Union[Image.Image, None]) -> str:
     # 2. 如果上传了图片
     if image is not None:
         text = call_ocr_model(image)
-        # 如果前面已经有 PDF 结果，就在后面追加，否则单独一段
         if results:
             results.append("===== 图片识别结果 =====\n" + text)
         else:

     for i in range(n_pages):
         page = pdf[i]
+        # 72 dpi 是 PDF 默认分辨率，这里按比例放大到指定 dpi
+        pil_image = page.render(scale=dpi / 72).to_pil()
         images.append(pil_image)
     return images
     # 2. 如果上传了图片
     if image is not None:
         text = call_ocr_model(image)
         if results:
             results.append("===== 图片识别结果 =====\n" + text)
         else: