PP-Structure 系列模型列表
1. 版面分析模型
| 模型名称 | 
模型简介 | 
推理模型大小 | 
下载地址 | 
dict path | 
| picodet_lcnet_x1_0_fgd_layout | 
基于PicoDet LCNet_x1_0和FGD蒸馏在PubLayNet 数据集训练的英文版面分析模型,可以划分文字、标题、表格、图片以及列表5类区域 | 
9.7M | 
推理模型 / 训练模型 | 
PubLayNet dict | 
| ppyolov2_r50vd_dcn_365e_publaynet | 
基于PP-YOLOv2在PubLayNet数据集上训练的英文版面分析模型 | 
221.0M | 
推理模型 / 训练模型 | 
同上 | 
| picodet_lcnet_x1_0_fgd_layout_cdla | 
CDLA数据集训练的中文版面分析模型,可以划分为表格、图片、图片标题、表格、表格标题、页眉、脚本、引用、公式10类区域 | 
9.7M | 
推理模型 / 训练模型 | 
CDLA dict | 
| picodet_lcnet_x1_0_fgd_layout_table | 
表格数据集训练的版面分析模型,支持中英文文档表格区域的检测 | 
9.7M | 
推理模型 / 训练模型 | 
Table dict | 
| ppyolov2_r50vd_dcn_365e_tableBank_word | 
基于PP-YOLOv2在TableBank Word 数据集训练的版面分析模型,支持英文文档表格区域的检测 | 
221.0M | 
推理模型 | 
同上 | 
| ppyolov2_r50vd_dcn_365e_tableBank_latex | 
基于PP-YOLOv2在TableBank Latex数据集训练的版面分析模型,支持英文文档表格区域的检测 | 
221.0M | 
推理模型 | 
同上 | 
2. OCR和表格识别模型
2.1 OCR
| 模型名称 | 
模型简介 | 
推理模型大小 | 
下载地址 | 
| en_ppocr_mobile_v2.0_table_det | 
PubTabNet数据集训练的英文表格场景的文字检测 | 
4.7M | 
推理模型 / 训练模型 | 
| en_ppocr_mobile_v2.0_table_rec | 
PubTabNet数据集训练的英文表格场景的文字识别 | 
6.9M | 
推理模型 / 训练模型 | 
如需要使用其他OCR模型,可以在 PP-OCR model_list 下载模型或者使用自己训练好的模型配置到 det_model_dir, rec_model_dir两个字段即可。
2.2 表格识别模型
| 模型名称 | 
模型简介 | 
推理模型大小 | 
下载地址 | 
| en_ppocr_mobile_v2.0_table_structure | 
基于TableRec-RARE在PubTabNet数据集上训练的英文表格识别模型 | 
6.8M | 
推理模型 / 训练模型 | 
| en_ppstructure_mobile_v2.0_SLANet | 
基于SLANet在PubTabNet数据集上训练的英文表格识别模型 | 
9.2M | 
推理模型 / 训练模型 | 
| ch_ppstructure_mobile_v2.0_SLANet | 
基于SLANet的中文表格识别模型 | 
9.3M | 
推理模型 / 训练模型 | 
3. KIE模型
在XFUND_zh数据集上,不同模型的精度与V100 GPU上速度信息如下所示。
| 模型名称 | 
模型简介 | 
推理模型大小 | 
精度(hmean) | 
预测耗时(ms) | 
下载地址 | 
| ser_VI-LayoutXLM_xfund_zh | 
基于VI-LayoutXLM在xfund中文数据集上训练的SER模型 | 
1.1G | 
93.19% | 
15.49 | 
推理模型 / 训练模型 | 
| re_VI-LayoutXLM_xfund_zh | 
基于VI-LayoutXLM在xfund中文数据集上训练的RE模型 | 
1.1G | 
83.92% | 
15.49 | 
推理模型 / 训练模型 | 
| ser_LayoutXLM_xfund_zh | 
基于LayoutXLM在xfund中文数据集上训练的SER模型 | 
1.4G | 
90.38% | 
19.49 | 
推理模型 / 训练模型 | 
| re_LayoutXLM_xfund_zh | 
基于LayoutXLM在xfund中文数据集上训练的RE模型 | 
1.4G | 
74.83% | 
19.49 | 
推理模型 / 训练模型 | 
| ser_LayoutLMv2_xfund_zh | 
基于LayoutLMv2在xfund中文数据集上训练的SER模型 | 
778.0M | 
85.44% | 
31.46 | 
推理模型 / 训练模型 | 
| re_LayoutLMv2_xfund_zh | 
基于LayoutLMv2在xfun中文数据集上训练的RE模型 | 
765.0M | 
67.77% | 
31.46 | 
推理模型 coming soon / 训练模型 | 
| ser_LayoutLM_xfund_zh | 
基于LayoutLM在xfund中文数据集上训练的SER模型 | 
430.0M | 
77.31% | 
- | 
推理模型 / 训练模型 | 
- 注:上述预测耗时信息仅包含了inference模型的推理耗时,没有统计预处理与后处理耗时,测试环境为
V100 GPU + CUDA 10.2 + CUDNN 8.1.1 + TRT 7.2.3.4。 
在wildreceipt数据集上,SDMGR模型精度与下载地址如下所示。