英亚体育|首页英亚体育|首页

官方视频
英亚体育_Amazon研究人员用AI提高曲线文本识别,测试准确度超过83%
来源:英亚体育    发布时间:2021-01-25 11:28:01
本文摘要:光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。

光学文字识别(OCR)将手写或打印机文本的图像切换为机器可读文本,是可追溯到70年代初的技术。但是,由于长期以来OCR算法很难识别与水平面不平行的文字,Amazon的研究开发者开发了Texttubes这一技术。这是自然图像中曲线文本的检测器,可以将文本建模为包围其中轴线的管状。

在描述工作的论文中,合作者主张他们的方法在标准化的OCR基准上超过了最先进的设备。【照片来源:venturebeat所有者:venturebeat所】正如研究者说明的那样,场景文本一般分为文本检查和文本识别两个倒数任务。第一个是用于定位文字、单词和行,第二个是mRNA的内容。两者都说在一起更容易,自然环境中的文本不仅受到变形的影响,也不受视点变化和字体的影响。

该团队的解决方案是利用文本参照框架的管状表达形式,利用目标文本一般是大小相近的文字串联的事实,捕捉大部分可变性。与传统的方法相比,更容易重叠和产生噪音的矩形和四面形来捕捉文本信息,它被公式化为数学函数,需要训练机器学习场景文本检测器。

研究人员在CTW-1500上评价了TextTubes的性能。CTW-1500是数据集,该数据集由自然场景和图像库收集的1500张图像(每张图像最少1个曲线例),最多10000个文本例构成。同时在Total-Text上展开评价,Total-Text包括约1255次训练图像、300个测试图像和一个或多个曲线文本实例。

据报道,CTW-1500以83.65%的精度获得了业界领先的结果,最相似的方法精度为75.6%。对一个案例的中间轴和均值半径开展建模……能够捕捉到整个案例的信息。这篇论文的年度出版者写道。

英亚体育

在单词组成的数据集中,如Total-Text,我们的模式需要构建最先进的设备性能。在具备行级评论的数据集中,例如CTW-1500,我们的模型需要更好地捕捉例子中每个单词的文本信息。

如果有一天TextTubes需要使用的话,对于依赖OCR技术开展业务的企业来说,这可能是个好消息。据估计,80%以上的数字流程仍有纸张,约97%的中小企业仍在用于纸张支票。据GrandViewRearch的数据显示,到2025年,OCR解决方案市场的价值可能超过138亿8千万美元。(公共编号:)viaVB原创文章允许禁止发表。

下一篇文章发表了注意事项。


本文关键词:英亚体育

本文来源:英亚体育-www.juhuijianshe.com

上一新闻:玩转国际顶级IP微鲸推功夫熊猫定制版:英亚体育

下一新闻:英亚体育:3年血亏10亿美元,GoogleDeepMind出了什么问题?

推荐阅读

企业要闻

企业动态

门窗百科

太阳能着色 互补系统 易护理 保温 环保节能
预约报名 免费测量 免费设计 免费报价 免费安装 终身维护
版权所有©2011-2020 玉溪市英亚体育股份有限公司
滇ICP备77794362号-5
联系地址: 云南省玉溪市西区均滔大楼81号
联系电话:084-369561768
联系邮箱:663395747@qq.com
传真号码:032-43249120