![](https://static33.tgcnt.ru/posts/_0/d7/d71d2565aaa4190127c4fe9677441ca6.jpg)
🌈Marker — Python-утиліта для швидкого та точного перетворення PDF на MD
- pip install marker-pdf
Процес перетворення PDF за допомогою Marker складається з таких кроків:
- Вилучення тексту, при необхідності використання OCR (евристичні методи, Surya, Tesseract)
- Визначення макета сторінки та порядку читання (Surya)
- Підготовка та форматування кожного блоку (евристика, Texify)
- об'єднання блоків та постобробка повного тексту (Heuristics, Pdf_postprocessor)
Marker використовує ML-моделі лише там, де це необхідно, що підвищує швидкість та точність
Приклад використання:
marker_single /path/to/file.pdf /path/to/output/folder --batch_multiplier 2 --max_pages 10 --langs English
🐱GitHub
▪️Приклад використання
Python'er
- pip install marker-pdf
Процес перетворення PDF за допомогою Marker складається з таких кроків:
- Вилучення тексту, при необхідності використання OCR (евристичні методи, Surya, Tesseract)
- Визначення макета сторінки та порядку читання (Surya)
- Підготовка та форматування кожного блоку (евристика, Texify)
- об'єднання блоків та постобробка повного тексту (Heuristics, Pdf_postprocessor)
Marker використовує ML-моделі лише там, де це необхідно, що підвищує швидкість та точність
Приклад використання:
marker_single /path/to/file.pdf /path/to/output/folder --batch_multiplier 2 --max_pages 10 --langs English
🐱GitHub
▪️Приклад використання
Python'er