Skip to main content

PageSegMode

  • AUTO (3)

自动检测页面布局并进行识别。这是最常用的模式之一,Tesseract 会自动分析图像的布局,尝试确定文字的行、段落等结构,然后进行识别。适用于大多数普通文档图像。

  • SINGLE_COLUMN (4)

假定图像包含一个垂直排列的单列文本。当图像中的文字是以单列形式排列时,使用此模式可以更准确地识别文字,引擎会按照单列文本的结构进行处理。

  • SINGLE_BLOCK_VERT_TEXT (5)

假定图像包含一个垂直排列的文本块。如果图像中的文字是垂直书写的,并且形成一个整体的文本块,使用该模式可以更好地进行识别。

  • SINGLE_BLOCK (6)

假定图像包含一个统一的文本块。对于没有明显分行或段落结构的图像,如一些标语、横幅等,使用此模式可以将整个图像作为一个文本块进行识别。

  • SINGLE_LINE (7)

将图像视为单行文本进行识别。适用于只包含一行文字的图像,如标题、菜单等,引擎会专注于识别这一行文字。

  • SINGLE_WORD (8)

将图像视为单个单词进行识别。当图像中只包含一个单词时,使用此模式可以提高识别的准确性。

  • CIRCLE_WORD (9)

将图像视为单个单词,且该单词可能是圆形排列的。对于一些以圆形方式排列的文字,如商标、徽章上的文字,此模式可以更好地进行识别。

  • SINGLE_CHAR (10)

将图像视为单个字符进行识别。用于识别只包含一个字符的图像,例如验证码中的单个字符。

  • SPARSE_TEXT (11)

在图像中查找稀疏分布的文本,不进行特定的页面布局分析。当图像中的文字分布比较分散,没有明显的布局结构时,使用此模式可以找出所有的文字。

  • SPARSE_TEXT_OSD (12)

在图像中查找稀疏分布的文本,并进行方向和脚本检测。结合了方向和脚本检测功能,适用于文字分布稀疏且方向不确定的图像。

  • RAW_LINE (13)

直接将图像中的像素作为原始文本行进行识别,不进行任何页面分割或预处理。这种模式适用于一些特殊情况,如手写文字或经过特殊处理的图像,引擎会尽量直接识别像素中的文字信息。