一、PP-OCRv5多语种文字识别介绍¶

PP-OCRv5 是 PP-OCR 系列的最新一代文字识别解决方案，专注于多场景、多语种的文字识别任务。在文字类型支持方面，默认配置的识别模型可准确识别简体中文、中文拼音、繁体中文、英文和日文这五大主流文字类型。同时，PP-OCRv5还提供了覆盖106种语言的多语种文字识别能力，包括韩文、西班牙文、法文、葡萄牙文、德文、意大利文、俄罗斯文、泰文、希腊文等（具体支持语种及缩写详见第四节）。相较于前代 PP-OCRv3 版本，PP-OCRv5 在多语言文字识别准确率上实现了超过30%的提升。

法文识别结果

德文识别结果

韩文识别结果

俄文识别结果

泰文识别结果

希腊文识别结果

阿拉伯文识别结果

印地文识别结果

泰米尔文识别结果

泰卢固文识别结果

二、快速使用¶

您可以通过在命令行中使用 --lang 参数，来使用指定语种的文本识别模型进行通用 OCR 产线的推理：

# 通过 `--lang` 参数指定使用法语的识别模型
paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_french01.png \
    --lang fr \
    --use_doc_orientation_classify False \
    --use_doc_unwarping False \
    --use_textline_orientation False \
    --save_path ./output \
    --device gpu:0

上述命令行的其他参数说明请参考通用 OCR 产线的命令行使用方式, 运行后结果会被打印到终端上：

{'res': {'input_path': '/root/.paddlex/predict_input/general_ocr_french01.png', 'page_index': None, 'model_settings': {'use_doc_preprocessor': True, 'use_textline_orientation': False}, 'doc_preprocessor_res': {'input_path': None, 'page_index': None, 'model_settings': {'use_doc_orientation_classify': False, 'use_doc_unwarping': False}, 'angle': -1}, 'dt_polys': array([[[119,  23],
        ...,
        [118,  75]],

       ...,

       [[109, 506],
        ...,
        [108, 556]]], dtype=int16), 'text_det_params': {'limit_side_len': 64, 'limit_type': 'min', 'thresh': 0.3, 'max_side_limit': 4000, 'box_thresh': 0.6, 'unclip_ratio': 1.5}, 'text_type': 'general', 'textline_orientation_angles': array([-1, ..., -1]), 'text_rec_score_thresh': 0.0, 'rec_texts': ['mifere; la profpérité & les fuccès ac-', 'compagnent l’homme induftrieux.', 'Quel eft celui qui a acquis des ri-', 'cheffes, qui eft devenu puiffant, qui', 's’eft couvert de gloire, dont l’éloge', 'retentit par-tout, qui fiege au confeil', "du Roi? C'eft celui qui bannit la pa-", "reffe de fa maifon, & qui a dit à l'oifi-", 'veté : tu es mon ennemie.'], 'rec_scores': array([0.98409832, ..., 0.98091048]), 'rec_polys': array([[[119,  23],
        ...,
        [118,  75]],

       ...,

       [[109, 506],
        ...,
        [108, 556]]], dtype=int16), 'rec_boxes': array([[118, ...,  81],
       ...,
       [108, ..., 562]], dtype=int16)}}

若指定了save_path，则会保存可视化结果在save_path下。可视化结果如下：

您也可以使用 Python 代码，在通用 OCR 产线初始化时，通过 lang 参数来使用指定语种的识别模型：

from paddleocr import PaddleOCR

ocr = PaddleOCR(
    lang="fr" # 通过 lang 参数指定使用法语的识别模型
    use_doc_orientation_classify=False, # 通过 use_doc_orientation_classify 参数指定不使用文档方向分类模型
    use_doc_unwarping=False, # 通过 use_doc_unwarping 参数指定不使用文本图像矫正模型
    use_textline_orientation=False, # 通过 use_textline_orientation 参数指定不使用文本行方向分类模型
)
result = ocr.predict("https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/general_ocr_french01.png")
for res in result:
    res.print()
    res.save_to_img("output")
    res.save_to_json("output")

更过关于 PaddleOCR 类参数的说明参考通用 OCR 产线的脚本方式集成。

三、指标对比¶

模型	模型下载链接	对应数据集精度（%）	相比前代模型提升幅度 (%)
korean_PP-OCRv5_mobile_rec	推理模型/训练模型	88.0	65.0
latin_PP-OCRv5_mobile_rec	推理模型/训练模型	84.7	46.8
eslav_PP-OCRv5_mobile_rec	推理模型/训练模型	81.6	31.4
th_PP-OCRv5_mobile_rec	推理模型/训练模型	82.68	-
el_PP-OCRv5_mobile_rec	推理模型/训练模型	89.28	-
en_PP-OCRv5_mobile_rec	推理模型/训练模型	85.25	11.0
cyrillic_PP-OCRv5_mobile_rec	推理模型/训练模型	80.27	21.2
arabic_PP-OCRv5_mobile_rec	推理模型/训练模型	81.27	22.83
devanagari_PP-OCRv5_mobile_rec	推理模型/训练模型	84.96	68.26
te_PP-OCRv5_mobile_rec	推理模型/训练模型	87.65	43.47
ta_PP-OCRv5_mobile_rec	推理模型/训练模型	94.2	39.23

注： - 韩语数据集：PP-OCRv5 最新构建的包含了 5007 张韩语文本图片的识别数据集。 - 拉丁字母语言数据集：PP-OCRv5 最新构建的包含了 3111 张拉丁字母语言的文本图片识别数据集。 - 东斯拉夫语言数据集：PP-OCRv5 最新构建的包含了俄语、白俄罗斯语和乌克兰语共计 7031 张文本图片的识别数据集。 - 泰文数据集：PP-OCRv5 最新构建的泰文共计 4261 张文本图片的识别数据集。 - 希腊文数据集：PP-OCRv5 最新构建的希腊文共计 2799 张文本图片的识别数据集。 - 英文数据集：PP-OCRv5 最新构建的英文共计 6530 张文本图片的识别数据集。 - 西里尔语数据集：PP-OCRv5 最新构建的西里尔文共计 7600 张文本图片的识别数据集。 - 泰米尔语数据集：PP-OCRv5 最新构建的泰米尔语共计 2121 张文本图片的识别数据集。 - 泰卢固语数据集：PP-OCRv5 最新构建的泰卢固语共计 2478 张文本图片的识别数据集。 - 阿拉伯语数据集：PP-OCRv5 最新构建的阿拉伯、梵语等共计 2676 张文本图片的识别数据集。 - 天城文数据集：PP-OCRv5 最新构建的天城文共计 3611 张文本图片的识别数据集。

四、支持语种及缩写¶

语种	描述	缩写	语种	描述	缩写
中文	Chinese & English	ch	匈牙利文	Hungarian	hu
英文	English	en	塞尔维亚文（latin）	Serbian(latin)	rs_latin
法文	French	fr	印度尼西亚文	Indonesian	id
德文	German	de	欧西坦文	Occitan	oc
日文	Japanese	japan	冰岛文	Icelandic	is
韩文	Korean	korean	立陶宛文	Lithuanian	lt
中文繁体	Chinese Traditional	chinese_cht	毛利文	Maori	mi
南非荷兰文	Afrikaans	af	马来文	Malay	ms
意大利文	Italian	it	荷兰文	Dutch	nl
西班牙文	Spanish	es	挪威文	Norwegian	no
波斯尼亚文	Bosnian	bs	波兰文	Polish	pl
葡萄牙文	Portuguese	pt	斯洛伐克文	Slovak	sk
捷克文	Czech	cs	斯洛文尼亚文	Slovenian	sl
威尔士文	Welsh	cy	阿尔巴尼亚文	Albanian	sq
丹麦文	Danish	da	瑞典文	Swedish	sv
爱沙尼亚文	Estonian	et	西瓦希里文	Swahili	sw
爱尔兰文	Irish	ga	塔加洛文	Tagalog	tl
克罗地亚文	Croatian	hr	土耳其文	Turkish	tr
乌兹别克文	Uzbek	uz	拉丁文	Latin	la
俄罗斯文	Russian	ru	白俄罗斯文	Belarusian	be
乌克兰文	Ukranian	uk	泰文	Thai	th
希腊文	Greek	el	阿塞拜疆文	Azerbaijani	az
库尔德文	Kurdish	ku	拉脱维亚文	Latvian	lv
马耳他文	Maltese	mt	巴利文	Pali	pi
罗马尼亚文	Romanian	ro	越南文	Vietnamese	vi
芬兰文	Finnish	fi	巴斯克文	Basque	eu
加利西亚文	Galician	gl	卢森堡文	Luxembourgish	lb
罗曼什文	Romansh	rm	加泰罗尼亚文	Catalan	ca
克丘亚文	Quechua	qu	泰卢固文	Telugu	te
塞尔维亚语（西里尔字母）	Serbian (Cyrillic)	sr	保加利亚文	Bulgarian	bg
蒙古文	Mongolian	mn	阿布哈兹文	Abkhaz	ab
阿迪赫文	Adyghe	ady	卡巴尔达文	Kabardian	kbd
阿瓦尔文	Avar	av	达尔格瓦文	Dargwa	dar
印古什文	Ingush	inh	车臣文	Chechen	ce
拉克文	Lak	lki	列兹金文	Lezgian	lez
塔巴萨兰文	Tabasaran	tab	哈萨克文	Kazakh	kk
吉尔吉斯文	Kyrgyz	ky	塔吉克文	Tajik	tg
马其顿文	Macedonian	mk	鞑靼文	Tatar	tt
楚瓦什文	Chuvash	cv	巴什基尔文	Bashkir	ba
马里文	Mari	mhr	莫尔多瓦文	Moldovan	mo
乌德穆尔特文	Udmurt	udm	科米文	Komi	kv
奥塞梯文	Ossetian	os	布里亚特文	Buriat	bua
卡尔梅克文	Kalmyk	xal	图瓦文	Tuvinian	tyv
萨哈文	Sakha	sah	卡拉卡尔帕克语	Karakalpak	kaa
阿拉伯文	Arabic	ar	波斯文	Persian	fa
维吾尔文	Uyghur	ug	乌尔都文	Urdu	ur
普什图文	Pashto	ps	库尔德文	Kurdish	ku
信德文	Sindhi	sd	俾路支文	Balochi	bal
印地文	Hindi	hi	马拉地文	Marathi	mr
尼泊尔文	Nepali	ne	比哈尔文	Bihari	bh
迈蒂利文	Maithili	mai	古英文	Old English	ang
博杰普尔文	Bhojpuri	bho	马加希文	Magahi	mah
萨达里文	Sadri	sck	尼瓦尔文	Newar	new
孔卡尼文	Konkani	gom	梵文	Sanskrit	sa
哈里亚纳文	Haryanvi	bgc	泰米尔语	Tamil	ta

五、模型及其支持的语种¶

模型	支持语种
PP-OCRv5_server_rec	简体中文、繁体中文、英文、日文
PP-OCRv5_mobile_rec	简体中文、繁体中文、英文、日文
korean_PP-OCRv5_mobile_rec	韩文、英文
latin_PP-OCRv5_mobile_rec	法文、德文、南非荷兰文、意大利文、西班牙文、波斯尼亚文、葡萄牙文、捷克文、威尔士文、丹麦文、爱沙尼亚文、爱尔兰文、克罗地亚文、乌兹别克文、匈牙利文、塞尔维亚文（latin）、印度尼西亚文、欧西坦文、冰岛文、立陶宛文、毛利文、马来文、荷兰文、挪威文、波兰文、斯洛伐克文、斯洛文尼亚文、阿尔巴尼亚文、瑞典文、西瓦希里文、塔加洛文、土耳其文、拉丁文、阿塞拜疆文、库尔德文、拉脱维亚文、马耳他文、巴利文、罗马尼亚文、越南文、芬兰文、巴斯克文、加利西亚文、卢森堡文、罗曼什文、加泰罗尼亚文、克丘亚文
eslav_PP-OCRv5_mobile_rec	俄罗斯文、白俄罗斯文、乌克兰文、英文
th_PP-OCRv5_mobile_rec	泰文、英文
el_PP-OCRv5_mobile_rec	希腊文、英文
en_PP-OCRv5_mobile_rec	英文
cyrillic_PP-OCRv5_mobile_rec	俄罗斯文、白俄罗斯文、乌克兰文、塞尔维亚文（cyrillic）、保加利亚文、蒙古文、阿布哈兹文、阿迪赫文、卡巴尔达文、阿瓦尔文、达尔格瓦文、印古什文、车臣文、拉克文、列兹金文、塔巴萨兰文、哈萨克文、吉尔吉斯文、塔吉克文、马其顿文、鞑靼文、楚瓦什文、巴什基尔文、马里文、莫尔多瓦文、乌德穆尔特文、科米文、奥塞梯文、布里亚特文、卡尔梅克文、图瓦文、萨哈文、卡拉卡尔帕克文、英文
arabic_PP-OCRv5_mobile_rec	阿拉伯文、波斯文、维吾尔文、乌尔都文、普什图文、库尔德文、信德文、俾路支文、英文
devanagari_PP-OCRv5_mobile_rec	印地文，马拉地文，尼泊尔文，比哈尔文，迈蒂利文，古英文，博杰普尔文，马加希文，萨达里文，尼瓦尔文，孔卡尼文，梵文，哈里亚纳文、英文
ta_PP-OCRv5_mobile_rec	泰米尔文、英文
te_PP-OCRv5_mobile_rec	泰卢固文、英文

注： en_PP-OCRv5_mobile_rec 是在 PP-OCRv5 模型基础上，针对英文场景进行了定向优化，在处理英文文本时表现出更高的识别精度和更强的场景适应能力。

一、PP-OCRv5多语种文字识别介绍¶

二、快速使用¶

三、指标对比¶

四、 支持语种及缩写¶

五、模型及其支持的语种¶

评论

四、支持语种及缩写¶