通过亚马逊云科技OCR以及生成式AI产品加速关键内容提取与整理
背景介绍
光学字符识别(OCR)技术在识别印刷体或手写体文字方面已经取得了显著的进展,但仍然存在一些常见问题和挑战。以下是一些常见的OCR技术问题:
(一)文字质量:OCR系统对文字质量要求较高,如果文本模糊、扭曲、模糊不清或遭受损坏,识别准确率可能会降低。
(二)手写体识别:手写体文字识别是一个更具挑战性的任务,因为手写文字的风格和形状变化较大,而且可能存在连接、断开、变形等问题。
(三)文档类型多样性:处理不同类型的文档(如表格、报告、手写笔记等)需要OCR系统具备适应性,这可能需要更复杂的模型和处理流程。
(四)上下文理解:对于某些应用,理解文本的上下文是必要的,但传统的OCR技术可能缺乏这种上下文感知能力。
OCR技术是人们日常使用最多的AI场景,但处理以上问题仍遇到了很大的挑战。本文的目的是帮助大家通过亚马逊云科技OCR以及生成式AI(Gen-AI)产品加速关键内容提取与整理。
亚马逊云科技OCR相关产品/解决方案
(1)Amazon Textract是一种机器学习(ML)服务,可自动从任意文档或图像中提取文本、手写和数据。使用Amazon Textract的AnalyzeDocument API可提供表格功能,提供从任何文档中自动提取表格结构的功能。
(2)Amazon Rekognition是一项功能强大的图像和视频分析服务,可提取图像中的信息并提供深入洞察。其中的图像文本识别功能专门用于处理真实世界的图像,而不仅仅是文档图像。它支持大多数拉丁语书写体文本以及数字,并且可以识别嵌入在各种布局中、采用不同字体和样式、在不同方向上作为横幅和海报覆盖在背景对象上的文本。
(3)AWS AI Solution Kit提供一系列开箱即用的云上AI功能,例如:多语种高阶文字识别(OCR)、通用自然语言理解(NLU)、通用物体识别、图像超分、图片相似度、人像分割等。特别是AWS AI Solution Kit增强了对于简体中文语言识别能力。
通过使用亚马逊云科技提供的这三款OCR产品/解决方案,可以有效解决文字质量低、手写体识别等问题。尤其是Amazon Textract能够处理多种文件格式,包括JPG、PNG、PDF等,并且能够处理扫描文档和手机拍摄的图片。除了提取文档中的内容(包括表格和表单字段等结构化数据),Amazon Textract还可以在满足个人隐私信息(PII)保护的前提下,分析发票、收据或身份证中的相关数据。
在进行OCR内容提取时,文件内容格式不固定且需要上下文语义理解,仅使用OCR无法完全解决这个问题。在这种情况下,引入大语言模型可以很好地帮助我们克服这些局限性,并加速文本内容的精确提取。
基于Bedrock进行OCR关键信息提取方案
Amazon Bedrock介绍
Amazon Bedrock服务于2023年9月28日正式可用,这是使用基础模型构建和扩展生成性人工智能应用程序的最简单方法。Amazon Bedrock是一项完全托管的服务,提供来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI和Amazon等领先提供商的高性能基础模型,以及客户构建生成式AI应用程序所需的一套广泛功能,简化开发,同时维护隐私和安全。
在Amazon Bedrock上,用户可以享受可扩展、可靠且安全的亚马逊云科技托管服务,无需管理基础设施。
用户可以访问从文本到图像的一系列强大的基础模型,包括新发布的Amazon Titan基础模型。用户可以轻松找到适合自身业务的模型,快速上手。
用户可以在确保数据安全和隐私保护的前提下,使用自有数据基于基础模型进行定制。Bedrock最重要的能力之一是极其容易定制模型。客户只需向Bedrock展示Amazon S3中的几个标注好的数据示例,Bedrock就可以针对特定任务微调模型,最少仅需20个示例即可,而无需标注大量数据。
没有任何用户数据被用于训练底层模型。所有数据都进行了加密,且不会离开用户的虚拟私有网络(VPC),因此用户完全可以确信获得数据安全和隐私保护。
Claude模型介绍与使用申请
通过Bedrock您可以快速访问Claude API。Claude V2具有更好的性能和更长的回复时间。用户可以在每个提示中输入多达100K,这意味着Claude可以处理数百页的技术文档甚至一本书。更重要的是,Claude在交流中表现出色,能够清晰地解释其思路,几乎不会产生有害的输出,并且具有超强的记忆力。
在编码、数学和推理方面,最新的模型在法学考试的多项选择部分得分为76.5%,而Claude1.3的得分为73.0%。与申请研究生院的大学生相比,Claude2在GRE阅读和写作考试中超过了90%的排名,并且在定量推理方面与中位数申请者成绩相当。
当您首次登陆Bedrock时,需要通过左下角模型列表(Model Access)中选择,请求访问在Bedrock中使用的模型。比如Anthropic Claude模型能首先需要提交一些使用详细信息,然后才能获得访问权限。请注意,只有具有所需IAM权限的用户才能管理此帐户的模型访问权限。
实现方案架构
操作配置
Amazon Lambda配置说明
进入到Lambda控制台,按照以下配置创建一个新的函数。
函数名称:填写你的函数名称,如bedrock_demo
运行时:选择Python 3.10
架构:选择x86_64
权限:创建具有基本Lambda权限的新角色
点击创建函数
创建完Lambda函数之后,修改Lambda函数配置,方便后续进行测试。
首先修改Lambda函数的超时时间,设置为1分钟
创建名为bedrock的策略
Lambda函数的角色权限,点击该角色,并将以下2个策略(AmazonS3FullAccess,AmazonTextractFullAccess),以及刚创建的bedrock策略附加到该角色上
由于Amazon Bedrock需要特定版本的Boto3 SDK,因此需要进行下载安装,并通过Layer的方式上传到Lambda中。
以下脚本会下载boto3最新版本,re-zip并将其上传到S3存储桶当中,上传完之后进行删除
需要将BUCKET_NAME替换为你的S3存储桶,该存储桶与你的Lambda函数在同个区域
另外需要修改.sh文件的权限
在Lambda创建Layer层,并将存储在S3存储桶的zip文件上传
BUCKET_NAME替换为存储zip文件的存储桶
点击创建
为你的Lambda函数添加刚才创建的Layer层
Amazon API Gateway配置说明
进入到API Gateway控制台,按照以下配置创建一个新的函数。
创建REST API
API详细信息:选择新建API
API名称:填写你的API名称,如my_api
点击创建API
创建完API之后,点击创建方法,方便我们后续进行测试。
在以下创建方法的界面中进行配置。
方法类型:选择POST类型
集成类型:选择Lambda函数
Lambda函数:选择在1部分创建的Lambda函数
点击创建方法
在该POST方法中,在集成请求将Lambda代理集成开启
在API设置将二进制媒体类型添加image/jpg以及image/jpeg
在创建的API界面,点击部署API,选择一个新阶段,并添加阶段名称
在阶段选择你创建的阶段,并复制调用URL,后续使用该URL进行测试
Amazon Lambda代码实现
将代码复制到Lambda函数中,并点击Deploy进行部署。
结果验证
如下图验光处方单由于格式不统一或医生笔记难以识读,提取关键参数具有一定难度。为快速获取处方参数,采用大模型Claude对包含内容注释的问题文本进行语义理解,提取出球面度数(SPH)、柱面度数(CYL)、散光轴位(AXIS)和近视加力(ADD),并将缺失参数填充为“N/A”,最后转换为结构化的JSON格式数据,以便后续应用。此方案既可处理非结构化文本,又可实现参数提取和结构化,可有效提升处方信息的采集效率。
总结
本文介绍了一套完整的解决方案,旨在有效解决文字质量低、手写体识别、文档类型多样性以及上下文理解等问题。利用Amazon API Gateway+Lambda+S3+Textract+ Bedrock构建了一个无服务器应用,无需进行运维管理。在无固定模板的样例中,相比传统的OCR正则匹配方法可以极大地提升准确率。优势在于它的灵活性和可扩展性,开发者无需依赖固定的模板,可以适应各种文档类型和样式。而且根据需要轻松地调整和改进模型,以进一步提高准确率和性能。
原标题:Amazon Bedrock大语言模型加速OCR场景精准提取
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
标签:
相关阅读
404 Not Found
精彩推荐
404 Not Found
阅读排行
404 Not Found
相关词
- 天舟五号撤离空间站组合体
- 闪耀暖暖绚彩星梦活动介绍
- 电脑磁盘故障怎么恢复
- 出生“一件事”长三角跨省通办
- 什么牌子的奶粉吸收好,美素佳儿源悦浅测评
- c盘文件恢复后打不开了怎么办
- 华为mate60pro芯片哪里生产
- 《上古纷争》英雄介绍 暗系诅咒虚弱「洛基」
- 数字里看发展 我国教师队伍结构不断优化、素质不断提升
- 潭牛文昌鸡:打造文昌鸡产业“海南样板”
- 内蒙古巴彦淖尔环境综合治理显成效 “塞外明珠”被“擦亮”
- 河北省兴隆县举办2023年“质量月”活动启动仪式
- 青岛—加德满都航线正式开航
- 土豆骑士好玩吗 土豆骑士玩法简介
- 三亚拟对35条街道进行精品化建设改造
- 四川省资阳市特检所开展工业管道安全隐患排查
- 如何修复遭损坏cserhelper.dll方法
- 重庆市北碚区市场监管局用好“三面镜子”保障群众“两节”食品安全
- 狂欢,以啤酒的名义!2023儋州青岛啤酒节即将火热开启
- 比亚迪海豹DM-i重磅上市
- 未来智能豪华轿跑阿维塔12全球首秀
- 湖北机场集团与杜福睿集团签订合资合作协议
- 海南航空无陪儿童服务升级,安心呵护服务“可视”
- 华为手机如何给财神爷上香
- 从“制造”走向“质造”!长沙启动“质量月”活动
- 提示wshqos.dll丢失报错如何解决
- 杭州新开迎亚运重点航线 直飞迪拜、阿拉木图
- 2023年“诚信兴商宣传月”启动仪式成功举办
- 文字玩出花美装天梯怎么过关 文字玩出花美装天梯通关攻略
- 山东:打造中医药传承创新“齐鲁路径”
- 嘉善赴上海专场路演科创项目
- 万联证券:化妆品行业个股业绩表现分化 静候需求端修复
- 命运方舟寂静岛岛之心怎么获取 命运方舟寂静岛岛之心获取方法
- 安信证券:原油有望高位震荡带动上游资本开支 油服行业景气向好
- 临高开展客车整治行动
- 美邦股份可转债募资必要性合理性存疑
- 二〇二三年国家网络安全宣传周开幕式举行
- 上海37家市级医院开启科普宣传周
- 重庆市巴南区“四个重点”开展电子计价秤专项整治行动
- 虚销“空气粮” 私卖“升溢粮” 假购“增数粮”
- 中信建投:8月社融超预期 三大拐点确立下银行股估值将明显修复
- 今年“月饼圈”斑兰成“新宠” 海南多家企业推出“斑兰月饼”
- 难忘师生情 华夏航空开展教师节空地活动
- 别走错!广州地铁这个站点出入口有调整
- 《宝可梦:大集结》火焰鸡新演示 9月14日上线
- 《动物派对》发布联动“白菜狗”预告视频 推出联动皮肤
- 山东 | 山水禅心,锦绣五莲
- 《漫威蜘蛛侠2》因为版权问题纽约没有克莱斯勒大厦
- AR手游《怪物猎人Now》真人发售预告 9月14日上线
- 山西证券:8月汽车产销超预期 行业景气度继续提升
- 2023年国家网络安全宣传周网络安全博览会举办
- 10个重点行业稳增长方案发布
- 科普园地|复杂的三体问题存在上万个解决方案?
- 回暖!央行公布关键数据,释放什么信号?
- 央行:8月末社会融资规模存量为368.61万亿元,同比增长9%
- 《鬼灭之刃》派对游戏新作正式公开 2024年发售!
- 民营企业借力资本市场持续做优做强
- 中国中小企业发展指数连续3个月上升
- 汽车市场“淡季不淡” 促消费政策效应渐显
- CIOE 2023丨深挖场景价值,共连数字化美好未来
- 《女神异闻录 异空之塔篇》9月14日登陆Switch PC版稍后推出
- 《心灵杀手2》发布新8分钟实机视频 第三人称女探员战斗
- 《暗黑破坏神4》1.14补丁说明 赛季经验加成提升!
- 网传《GTA6》售价定为150美元 玩家们有点慌了!
- 《诱拐事件》steam页面上线 写实风格恐怖新游
- 第十二届“郑仙非遗文化月”开幕 6场系列活动等你来
- “潘鹤与新中国雕塑研究展”开幕
- 安徽宁国:畲乡晒秋庆丰收
- 为全球跨境投资提供“中国样本”
- 《Crisol: Theater of Idols》上线Steam 第一人称恐怖新游
- 中国中小企业发展指数连续三个月上升
- 上海崇明港西渔光互补光伏发电项目全容量并网
- 海珠区建筑联盟成立
- 《卧龙:苍天陨落》DLC“称霸江东”短片 新怪物可怕
- 2023绿色低碳创新论坛举行 科技部:将建碳达峰碳中和科技创新监测评价机制
- 增城|派潭“村晚”走进上九陂村
- 育碧免费FPS游戏《不羁联盟》延期 因未通过主机验证测试
- 《极限竞速:Motorsport》发布18分钟实机预告视频
- 2023世界智能网联汽车大会将于9月20日至24日在京召开
- 《消逝的光芒2》出现大量差评:禁用MOD、微交易!
- 江苏实现换电重卡跨城际多主体互通互换
- 利德治疗仪:高新技术领军,打造健康产业
- LPL:周淑怡恋情败露,得罪大量铁粉,与劣迹艺人拍拖,下场悲惨
- 北京发布地质灾害气象风险黄色预警
- 如何解决iasacct.dll加载错误问题?
- 广东将防汛Ⅱ级应急响应调整至Ⅲ级
- 广深城际9日停运56趟列车
- 3dmax2012缺少dll文件处理有哪些方法
- 孕期吃的比平时多很多,为什么还会贫血?常见于3种原因!
- 崩坏学园2负重提高途径推荐 崩坏学园2怎么提高负重
- 今明两天,海南岛部分地区有大到暴雨、雷暴大风!儋州最新天气
- 北京石景山发布暴雨黄色预警和地质灾害蓝色预警
- 就爱做蛋糕好玩吗 就爱做蛋糕玩法简介
- jpeg2000.dll重新安装的解决方法
- 中央气象台9月9日10时继续发布暴雨黄色预警
- Win11宽带连接方法
- 汽车销售模拟器好玩吗 汽车销售模拟器玩法简介
- 原神灵矩关湖宝箱在哪里-灵矩关湖宝箱在哪里介绍
- 保卫萝卜4新春厨艺秀第8关怎么过
- 罗马诺:尤文计划与拉比奥特商谈续约,球员合同明夏到期
- 我国科学家第一次在高山上发现陨石坑
- 抖音简笔画小人(抖音简笔画)
- 车库被淹,物业未及时通知挪车,要担责吗?法院判了!
- 人人都离不开工具!PPT之父去世:塑造现代社会信息沟通方式
- 新疆博湖县南美白对虾喜获丰收
- 穿越时光的“慢火车”,大山深处最美的风景
- 当“非遗藤编”走向世界
- 天命奇御战斗模式及八卦修炼系统体验心得 游戏通关心得分享
- “追梦少年”来到中国青年报 探秘“一张纸的力量”
- 福州暴雨集中区受灾村的防汛抢险48小时
- 开学季高校校长花式宠新:有的凌晨还在接机,有的亲手制作非遗糕点,还有的送上生日蛋糕
- 周杰伦天津演唱会发生意外?经纪公司凌晨回应
- 兰州通报“网民反映污水排入黄河”调查情况
- 电脑蓝屏后键盘鼠标都不亮怎么办
- 工业题材电影创作研讨会在京举办
- 房企动态|金泰樾系三子,金地清峯上、招商雲蘭营销中心开放!
- 电影《不虚此行》北京首映礼:共睹人间璀璨
- 图块排序什么时候出 公测上线时间预告
- 非遗“西秦刺绣”造就锦绣产业丨高质量发展调研行
- 双柏绿孔雀文化季推介会在昆明举行
- steam怎么查账户价值 Steam账号价值计算公式
- 命运方舟托托银发岛岛之心怎么获取
- 怎么让群里发布淫秽的人坐牢
- 沃尔夫小吃店官网在哪下载 最新官方下载安装地址
- 第七史诗瑟琳值得抽吗 第七史诗瑟琳抽取建议
- 如何处理win7专业版安装atl71.dll问题
- 彩虹色彩跑酷什么时候出 公测上线时间预告
- 和平精英特斯拉的工厂展厅在哪 和平精英特斯拉在哪里
- 如何解决提示d3dref.dll缺失报错问题
- 《文字来找茬》公园太离谱通关攻略网民推荐
- 海口:9月10日教师可免费乘坐公交车
- 黑色悖论官网在哪下载 最新官方下载安装地址
- 空中支援射击3D好玩吗 空中支援射击3D玩法简介
- “大人的文具”快闪来啦|文末有福利
- 金融巨头又要裁员!
- 甘肃定西将举办马铃薯大会,产业蓝皮书编纂将启动
- 广东广西局地仍有强降雨 北方冷空气持续发威
- 蚂蚁集团发布金融大模型:用大模型重写金融服务链条关键环节
- 二十国集团领导人第十八次峰会开幕
- 安徽东至尧渡镇:构建基层治理新格局 为幸福生活“加码”
- 如何一键修复nlsdata000a.dll丢失
- 米加世界粉色公寓官网在哪下载 最新官方下载安装地址
- 2-3负王曼昱!陈梦赛后突收坏消息,马琳无奈,或无缘巴黎奥运会
- 武汉黄陂区:清风抚山水 清廉聚民心
- 安徽11选五开奖走势图表 安徽11选五开奖走势图
- 美网魔咒再现!阿卡出局!底线端被打爆,梅总会师德约上演巅峰对决
- 湖北十堰茅箭区:“智”水新模式擦亮绿色生态底色
- 安庆市宜秀区白泽湖乡:智慧农业促振兴 科普宣传润民心
- “驻华使节地方行”活动在江苏举行
- 提示msvcr80d.dll丢失报错如何解决