课题责任人:王大寒
研究目标和研究内容:
本项目的目标是,针对低质图像中字符的分割和提取问题,结合基于滑动窗口的方法和基于字符检测的方法,提出和实现一套准确提取候选字符边框的字符分割和提取算法,并在此基础上构建几何模型,以提高低质量图像中字符/文本检测和识别率。该项目的研究成果可以应用于任何场景下(比如场景文本识别、退化历史文档处理和识别等)的低质图像中字符的检测和识别问题。
研究内容包括:
1、基于Color-enhanced CER的文本检测和字符提取
主要研究基于Color-enhanced CER的文本检测方法,以从图像中提取出较为准确的文本区域。在此基础上,研究基于滑动窗口和Color-enhanced CER的字符准确边框提取方法,以进一步得到准确的字符边框
2、基于几何模型建模和多信息融合的文本识别
在准确的文本检测和字符边框提取的基础上,研究几何模型的特征提取和建模方法,并将几何模型、字符识别等多种有效信息进行融合,以提高场景文本的识别率。