朝歌数码是什么(朝歌科技申请文本识别数据集制作方法专利,大大提升了模型训练的效率)

金融界2024年1月12日消息,据国家知识产权局公告,北京朝歌数码科技股份有限公司申请一项名为“文本识别数据集制作方法、计算机设备和计算机存储介质“,公开号CN117392687A,申请日期为2023年8月。

专利摘要显示,本公开的实施例公开了文本识别数据集制作方法、计算机设备和计算机存储介质。该方法的一具体实施方式包括:确定任务类型对应的字符组合类别数量;对于字符组合类别数量对应的每个字符组合类别,执行如下处理步骤:将字符列表中的每个字符作为首字符,随机生成对应字符组合类别的字符组合组;根据所生成的各个字符组合组,构建字符文件集;对于字符文件集中的每个字符文件,根据背景图库与字体库,生成对应字流量套餐符组合的字符图像与图像标注文件;根据所生成的各个字符图像与图像标注文件,构建图像训练样本集;根据字符列表,生成验证样本数据集。该实施方式极大地丰富了训练数据集,大大提升了模型训练的效率。

本文源自金融界


友情提醒: 请添加客服微信进行免费领取流量卡!
QQ交流群:226333560 站长微信:qgzmt2

原创文章,作者:sunyaqun,如若转载,请注明出处:https://www.dallk.cn/72890.html

(0)
sunyaqunsunyaqun
上一篇 2024年12月12日
下一篇 2024年12月12日

相关推荐

发表回复

登录后才能评论