MinerU是一个将PDF转换为机器可读格式的工具(例如,markdown,JSON),允许轻松提取为任何格式。
https://github.com/opendatalab/MinerU/blob/master/README.md
819e6