Release v3.0.2 · PaddlePaddle/PaddleOCR

功能新增：
- 模型默认下载源从BOS改为HuggingFace，同时也支持用户通过更改环境变量PADDLE_PDX_MODEL_SOURCE为BOS，将模型下载源设置为百度云对象存储BOS。
- PP-OCRv5、PP-StructureV3、PP-ChatOCRv4等pipeline新增C++、Java、Go、C#、Node.js、PHP 6种语言的服务调用示例。
- 优化PP-StructureV3产线中版面分区排序算法，对复杂竖版版面排序逻辑进行完善，进一步提升了复杂版面排序效果。
- 优化模型选择逻辑，当指定语言、未指定模型版本时，自动选择支持该语言的最新版本的模型。
- 为MKL-DNN缓存大小设置默认上界，防止缓存无限增长。同时，支持用户配置缓存容量。
- 更新高性能推理默认配置，支持Paddle MKL-DNN加速。优化高性能推理自动配置逻辑，支持更智能的配置选择。
- 调整默认设备获取逻辑，考虑环境中安装的Paddle框架对计算设备的实际支持情况，使程序行为更符合直觉。
- 新增PP-OCRv5的Android端示例，详情。
Bug修复：
- 修复PP-StructureV3部分CLI参数不生效的问题。
- 修复部分情况下export_paddlex_config_to_yaml无法正常工作的问题。
- 修复save_path实际行为与文档描述不符的问题。
- 修复基础服务化部署在使用MKL-DNN时可能出现的多线程错误。
- 修复Latex-OCR模型的图像预处理的通道顺序错误。
- 修复文本识别模块保存可视化图像的通道顺序错误。
- 修复PP-StructureV3中表格可视化结果通道顺序错误。
- 修复PP-StructureV3产线中极特殊的情况下，计算overlap_ratio时，变量溢出问题。
文档优化：
- 更新文档中对enable_mkldnn参数的说明，使其更准确地描述程序的实际行为。
- 修复文档中对lang和ocr_version参数描述的错误。
- 补充通过CLI导出产线配置文件的说明。
- 修复PP-OCRv5性能数据表格中的列缺失问题。
- 润色PP-StructureV3在不同配置下的benchmark指标。
其他：
- 放松numpy、pandas等依赖的版本限制，恢复对Python 3.12的支持。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

v3.0.2

Uh oh!