Skip to main content

文字区域检测

在图像中定位和标记出包含文本的区域。该模块的性能直接影响到整个OCR系统的准确性和效率。

TextDetection

子流程

不支持

运行参数

图像 ¹

包含文字的图片。

图像边长限制类型 ²

[短边] 表示确保图片最短边不小于 [文本检测的图片边长限制]，[长边] 表示确保图片最长边不大于 [文本检测的图片边长限制]。

图片边长限制 ³

对于文本密集的大图像，如果想要更准确的识别，应该选择更大的尺寸。此参数与[文本检测的图像边长限制类型]配合使用。通常，[长边]的最大值适用于图像较大且文本密集的场景，[短边]的最小值适用于图像较小且文本密集的文档场景。

文本检测像素阈值 ⁴

在输出概率图中，只有得分大于阈值的像素才被视为文本像素，取值范围为 0 ~ 1。

文本检测框阈值 ⁵

当检测结果边框内所有像素的平均得分大于阈值时，该结果将被视为文本区域，取值范围为 0 至 1。如果出现漏检，可以适当降低此值。

文本检测去裁剪比例 ⁶

使用此方法扩展文本区域。值越大，扩展区域越大。

输出

参考 DetectionResults。

其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple

子流程
运行参数
输出
- 其它