Skip to main content

文字区域检测

在图像中定位和标记出包含文本的区域。该模块的性能直接影响到整个OCR系统的准确性和效率。

TextDetection

子流程

不支持

运行参数

  • 图像 1

包含文字的图片。

  • 图像边长限制类型 2

[短边] 表示确保图片最短边不小于 [文本检测的图片边长限制],[长边] 表示确保图片最长边不大于 [文本检测的图片边长限制]。

  • 图片边长限制 3

对于文本密集的大图像,如果想要更准确的识别,应该选择更大的尺寸。此参数与[文本检测的图像边长限制类型]配合使用。通常,[长边]的最大值适用于图像较大且文本密集的场景,[短边]的最小值适用于图像较小且文本密集的文档场景。

  • 文本检测像素阈值 4

在输出概率图中,只有得分大于阈值的像素才被视为文本像素,取值范围为 0 ~ 1

  • 文本检测框阈值 5

当检测结果边框内所有像素的平均得分大于阈值时,该结果将被视为文本区域,取值范围为 01。如果出现漏检,可以适当降低此值。

  • 文本检测去裁剪比例 6

使用此方法扩展文本区域。值越大,扩展区域越大。

输出

参考 DetectionResults

其它

示例 https://github.com/shelllet/WinUi/blob/main/dnn/TextRecognition.simple