PageSegMode

自动检测页面布局并进行识别。这是最常用的模式之一，Tesseract 会自动分析图像的布局，尝试确定文字的行、段落等结构，然后进行识别。适用于大多数普通文档图像。

假定图像包含一个垂直排列的单列文本。当图像中的文字是以单列形式排列时，使用此模式可以更准确地识别文字，引擎会按照单列文本的结构进行处理。

假定图像包含一个垂直排列的文本块。如果图像中的文字是垂直书写的，并且形成一个整体的文本块，使用该模式可以更好地进行识别。

假定图像包含一个统一的文本块。对于没有明显分行或段落结构的图像，如一些标语、横幅等，使用此模式可以将整个图像作为一个文本块进行识别。

将图像视为单行文本进行识别。适用于只包含一行文字的图像，如标题、菜单等，引擎会专注于识别这一行文字。

将图像视为单个单词进行识别。当图像中只包含一个单词时，使用此模式可以提高识别的准确性。

将图像视为单个单词，且该单词可能是圆形排列的。对于一些以圆形方式排列的文字，如商标、徽章上的文字，此模式可以更好地进行识别。

将图像视为单个字符进行识别。用于识别只包含一个字符的图像，例如验证码中的单个字符。

在图像中查找稀疏分布的文本，不进行特定的页面布局分析。当图像中的文字分布比较分散，没有明显的布局结构时，使用此模式可以找出所有的文字。

在图像中查找稀疏分布的文本，并进行方向和脚本检测。结合了方向和脚本检测功能，适用于文字分布稀疏且方向不确定的图像。

直接将图像中的像素作为原始文本行进行识别，不进行任何页面分割或预处理。这种模式适用于一些特殊情况，如手写文字或经过特殊处理的图像，引擎会尽量直接识别像素中的文字信息。