亚马逊云科技大语言模型配合Langchain Agent,降低文生图门槛
背景
随着GenAI的流行,利用Stable Diffusion等方式通过使用文本描述的方式生成图片的方式在很大程度上降低了图片创作的门槛,并在包括创意图生成、营销图生成等多个领域投入了实际生产之中,提升了生产力。与此同时,这一类的生图工具又带来了一系列的新的学习门槛,尤其是在提示词工程上,为了写出好的提示词,需要用户进行系统的学习不同模型适合的提示词,并且不断的尝试。而且,仅支持英语的提示词也对非英语国家用户造成了一定的困难。本文通过亚马逊云科技Amazon Bedrock支持的大语言模型以及Stable Diffusion模型,配合Langchain Agent实现了交互式文生图功能,用户可以要求Langchain Agent根据其指令反复调整提示词并生成图片以达到无需提示词工程且较为精细化控制图片生成的效果。
Amazon Bedrock
Amazon Bedrock是一项完全托管的服务,使用单个API提供来自AI21 Labs、Anthropic、Cohere、Meta、Stability AI和Amazon等领先人工智能公司的高性能基础模型(FM),以及构建生成式人工智能应用程序所需的一系列广泛功能,在维护隐私和安全的同时简化开发。借助Amazon Bedrock的全面功能,可以轻松尝试各种热门FM,使用微调和检索增强生成(RAG)等技术利用您的数据对其进行私人定制,并创建可执行复杂业务任务(从预订旅行和处理保险索赔到制作广告活动和管理库存)的托管代理,所有这些都无需编写任何代码。由于Amazon Bedrock是无服务器的,因此无需管理任何基础设施,并且可以使用已经熟悉的亚马逊云科技服务将生成式人工智能功能安全地集成和部署到您的应用程序中。
Langchain
LangChain是一个用于开发由语言模型驱动的应用程序的框架。它使应用程序具备以下功能:
具备上下文感知:将语言模型与上下文来源(提示指令、少量示例、内容以支持其响应等)连接在一起。
具备推理能力:依赖语言模型进行推理(根据提供的上下文来确定如何回答问题,采取什么行动等)。
Chain
单独使用语言模型(LLM)对于简单的应用程序来说是可以的,但更复杂的应用程序需要将LLMs进行串联——要么相互串联,要么与其他组件串联。
LangChain提供了两个高级框架用于“chaining”组件。传统方法是使用Chain接口;更新的方法是使用LangChain表达式语言(LCEL)。在构建新应用程序时,建议使用LCEL进行链式组合。但也支持许多有用的内置Chain,因此在这里记录了这两种框架。
Agents
代理(agents)的核心理念是使用语言模型(LLM)来选择要执行的一系列操作。在链条(chains)中,一系列操作是硬编码的(在代码中)。而在代理中,语言模型被用作推理引擎,以确定要执行哪些操作以及以何种顺序执行这些操作,这其中又包含两个重要组件:Agent和Tool。
Agent:Agent负责决定Chain接下来要采取的步骤,它由一个语言模型和一个提示来驱动,不同的代理具有不同的推理方式、不同的输入编码方式以及不同的输出解析方式,本文中使用的Agent类型为ReAct Agent,是一种将推理和行动与LLMs结合的通用范式。“ReAct”通过Prompt的设计,为大语言模型制定了一个任务生成的口头推理和执行行动的过程。这使得大语言模型应用在执行动态推理的同时,能够创建、维护和调整行动计划,并与外部环境进行交互,将附加信息纳入推理过程。
Tool:Tool为Agent提供了调用的功能,帮助Agent访问不同的数据集,LangChain提供了一组广泛的工具供您开始使用,同时还可以轻松定义自己的工具。
Memory
大多数语言模型应用都具有会话式界面。会话的一个重要组成部分是能够引用先前在对话中提到的信息。最基本的情况下,一个会话系统应该能够直接访问一定范围内的先前消息。更复杂的系统需要具备一个不断更新的世界模型,使其能够维护关于实体及其关系的信息等等。我们将这种存储关于过去互动的信息的能力称为“Memory”。LangChain提供了许多实用工具,用于为系统添加Memory。这些实用工具可以单独使用,也可以无缝地集成到Chain中。
实现
架构
本文中测试脚本适用于Mac环境,Windows/Linux环境需要做相应的适配,其中Langchain和Bedrock交互架构图如下所示:
准备工作
IAM用户
需要调用Bedrock的模型同时将交互过程中产生的图片放置到S3中,所以需要预先给IAM User这方面的权限。
同时需要在Bedrock中配置可以使用的Model。
ANACONDA安装
环境配置
创建两个文件。在命令行中执行。
在Jupyter Lab中创建一个Notebook。首先我们引入需要的依赖项并且初始化Bedrock和S3的客户端。
然后我们创建用来生成提示词的工具generate_prompt_api,在这个工具内部,使用LLMChain来引导大语言模型生成提示词。这里选用了Anthropic的Claude模型。generate_prompt_api函数的注释描述了工具的用途和输入输出,这些信息会被Langchain Agent捕获到,用来指导这一工具的使用时机和方式。这里还调整了LLMChain的提示词模板prompt_template,使它更符合Claude模型的要求。对于返回值,也做了裁剪,只留下生成的提示词部分。
另外需要定义用来文生图的工具text_to_image_api。使用了Stable Diffusion XL模型。由于Bedrock在调用Stable Diffusion时会返回base64编码的图片,需要解码后进行展示,同时,也把图片存到S3上,并且生成了临时的URL方便共享使用。
最后,把以上工具、记忆功能(memory)组装到Langchain Agent中,此处Langchain Agent也使用Anthropic的Claude模型作为它的“大脑”。
实验
英文Prompt测试
1. 首先先让Agent生成一个好的提示词
2. 这个提示词还不错,画个图试试
3. 要求重新生成更好一点的prompt
4. 希望换个赛博朋克风格
5. 上面生成的图片中,没有足球了,要求必须有足球
6. 要求调整一下猫的颜色为黑色
通过实验可以发现,上述Agent可以比较好的识别指令,并根据上下文调整提示词并生成图片。但是随着对话轮次变多以及上下文变长,它有可能会遗忘一些关键信息,需要通过命令进行一些再次提示。
中文Prompt测试
1. 首先先测试通过中文输入生成英文的Prompt,从下面的结果来看还不错
2. 继续调整需求,将图片中的水牛换成河马,让其Prompt换成“提示词中把水牛改成河马,其他不变”,从结果来看其中水牛已成功换成了河马
3. 继续增加需求,修改图片的风格,油画风格更甚
4. 增加一些印象派元素
5. 增加一些莫奈风格
至此,通过基于英文和中文的Prompt分别测试了交互式的生成prompt,继而生成图片的场景,从结果来看还是可以的。当然,限于目前大语言模型的能力,多步推理的成功率并不太高,因此暂时还是让每个工具直接返回结果,相信随着模型能力的不断提升,这一流程能进一步简化。
总结
亚马逊云科技Amazon Bedrock作为一项完全托管的服务,用户只需要通过API的调用就可以完成基于LLM的推理工作,大大地降低了用户涉足AI的门槛,同时Serverless的方式也极大的降低了入门成本。本文通过基于对Bedrock API的调用,结合Langchain框架的调度,实现了一套多语言的交互式的文生图场景,可以让用户基于上下文的调整对于图片的需求,最终生成自己想要的图片。
原标题:使用Amazon Bedrock和Langchain Agent实现交互式文生图
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
标签:
相关阅读
404 Not Found
精彩推荐
404 Not Found
阅读排行
404 Not Found
相关词
- 重庆:七项任务提升基层能力
- 未来与李佳琦合作模式是否会有变化?花西子:不回复
- 天舟五号撤离空间站 完成多个空间应用项目实验
- ebueula.dll修复方法
- 天舟五号撤离空间站组合体
- 闪耀暖暖绚彩星梦活动介绍
- 电脑磁盘故障怎么恢复
- 出生“一件事”长三角跨省通办
- c盘文件恢复后打不开了怎么办
- 华为mate60pro芯片哪里生产
- 《上古纷争》英雄介绍 暗系诅咒虚弱「洛基」
- 数字里看发展 我国教师队伍结构不断优化、素质不断提升
- 潭牛文昌鸡:打造文昌鸡产业“海南样板”
- 内蒙古巴彦淖尔环境综合治理显成效 “塞外明珠”被“擦亮”
- 河北省兴隆县举办2023年“质量月”活动启动仪式
- 青岛—加德满都航线正式开航
- 土豆骑士好玩吗 土豆骑士玩法简介
- 三亚拟对35条街道进行精品化建设改造
- 四川省资阳市特检所开展工业管道安全隐患排查
- 如何修复遭损坏cserhelper.dll方法
- 重庆市北碚区市场监管局用好“三面镜子”保障群众“两节”食品安全
- 狂欢,以啤酒的名义!2023儋州青岛啤酒节即将火热开启
- 比亚迪海豹DM-i重磅上市
- 未来智能豪华轿跑阿维塔12全球首秀
- 湖北机场集团与杜福睿集团签订合资合作协议
- 海南航空无陪儿童服务升级,安心呵护服务“可视”
- 华为手机如何给财神爷上香
- 从“制造”走向“质造”!长沙启动“质量月”活动
- 提示wshqos.dll丢失报错如何解决
- 杭州新开迎亚运重点航线 直飞迪拜、阿拉木图
- 2023年“诚信兴商宣传月”启动仪式成功举办
- 文字玩出花美装天梯怎么过关 文字玩出花美装天梯通关攻略
- 山东:打造中医药传承创新“齐鲁路径”
- 嘉善赴上海专场路演科创项目
- 万联证券:化妆品行业个股业绩表现分化 静候需求端修复
- 命运方舟寂静岛岛之心怎么获取 命运方舟寂静岛岛之心获取方法
- 安信证券:原油有望高位震荡带动上游资本开支 油服行业景气向好
- 临高开展客车整治行动
- 美邦股份可转债募资必要性合理性存疑
- 二〇二三年国家网络安全宣传周开幕式举行
- 上海37家市级医院开启科普宣传周
- 重庆市巴南区“四个重点”开展电子计价秤专项整治行动
- 虚销“空气粮” 私卖“升溢粮” 假购“增数粮”
- 中信建投:8月社融超预期 三大拐点确立下银行股估值将明显修复
- 今年“月饼圈”斑兰成“新宠” 海南多家企业推出“斑兰月饼”
- 难忘师生情 华夏航空开展教师节空地活动
- 别走错!广州地铁这个站点出入口有调整
- 《宝可梦:大集结》火焰鸡新演示 9月14日上线
- 《动物派对》发布联动“白菜狗”预告视频 推出联动皮肤
- 山东 | 山水禅心,锦绣五莲
- 《漫威蜘蛛侠2》因为版权问题纽约没有克莱斯勒大厦
- AR手游《怪物猎人Now》真人发售预告 9月14日上线
- 山西证券:8月汽车产销超预期 行业景气度继续提升
- 2023年国家网络安全宣传周网络安全博览会举办
- 10个重点行业稳增长方案发布
- 科普园地|复杂的三体问题存在上万个解决方案?
- 回暖!央行公布关键数据,释放什么信号?
- 央行:8月末社会融资规模存量为368.61万亿元,同比增长9%
- 《鬼灭之刃》派对游戏新作正式公开 2024年发售!
- 民营企业借力资本市场持续做优做强
- 中国中小企业发展指数连续3个月上升
- 汽车市场“淡季不淡” 促消费政策效应渐显
- CIOE 2023丨深挖场景价值,共连数字化美好未来
- 《女神异闻录 异空之塔篇》9月14日登陆Switch PC版稍后推出
- 《心灵杀手2》发布新8分钟实机视频 第三人称女探员战斗
- 《暗黑破坏神4》1.14补丁说明 赛季经验加成提升!
- 网传《GTA6》售价定为150美元 玩家们有点慌了!
- 《诱拐事件》steam页面上线 写实风格恐怖新游
- 第十二届“郑仙非遗文化月”开幕 6场系列活动等你来
- “潘鹤与新中国雕塑研究展”开幕
- 安徽宁国:畲乡晒秋庆丰收
- 为全球跨境投资提供“中国样本”
- 《Crisol: Theater of Idols》上线Steam 第一人称恐怖新游
- 中国中小企业发展指数连续三个月上升
- 上海崇明港西渔光互补光伏发电项目全容量并网
- 海珠区建筑联盟成立
- 《卧龙:苍天陨落》DLC“称霸江东”短片 新怪物可怕
- 2023绿色低碳创新论坛举行 科技部:将建碳达峰碳中和科技创新监测评价机制
- 增城|派潭“村晚”走进上九陂村
- 育碧免费FPS游戏《不羁联盟》延期 因未通过主机验证测试
- 《极限竞速:Motorsport》发布18分钟实机预告视频
- 2023世界智能网联汽车大会将于9月20日至24日在京召开
- 《消逝的光芒2》出现大量差评:禁用MOD、微交易!
- 江苏实现换电重卡跨城际多主体互通互换
- 利德治疗仪:高新技术领军,打造健康产业
- LPL:周淑怡恋情败露,得罪大量铁粉,与劣迹艺人拍拖,下场悲惨
- 北京发布地质灾害气象风险黄色预警
- 如何解决iasacct.dll加载错误问题?
- 广东将防汛Ⅱ级应急响应调整至Ⅲ级
- 广深城际9日停运56趟列车
- 3dmax2012缺少dll文件处理有哪些方法
- 孕期吃的比平时多很多,为什么还会贫血?常见于3种原因!
- 崩坏学园2负重提高途径推荐 崩坏学园2怎么提高负重
- 今明两天,海南岛部分地区有大到暴雨、雷暴大风!儋州最新天气
- 北京石景山发布暴雨黄色预警和地质灾害蓝色预警
- 就爱做蛋糕好玩吗 就爱做蛋糕玩法简介
- jpeg2000.dll重新安装的解决方法
- 中央气象台9月9日10时继续发布暴雨黄色预警
- Win11宽带连接方法
- 汽车销售模拟器好玩吗 汽车销售模拟器玩法简介
- 原神灵矩关湖宝箱在哪里-灵矩关湖宝箱在哪里介绍
- 保卫萝卜4新春厨艺秀第8关怎么过
- 罗马诺:尤文计划与拉比奥特商谈续约,球员合同明夏到期
- 我国科学家第一次在高山上发现陨石坑
- 抖音简笔画小人(抖音简笔画)
- 车库被淹,物业未及时通知挪车,要担责吗?法院判了!
- 人人都离不开工具!PPT之父去世:塑造现代社会信息沟通方式
- 新疆博湖县南美白对虾喜获丰收
- 穿越时光的“慢火车”,大山深处最美的风景
- 当“非遗藤编”走向世界
- 天命奇御战斗模式及八卦修炼系统体验心得 游戏通关心得分享
- “追梦少年”来到中国青年报 探秘“一张纸的力量”
- 福州暴雨集中区受灾村的防汛抢险48小时
- 开学季高校校长花式宠新:有的凌晨还在接机,有的亲手制作非遗糕点,还有的送上生日蛋糕
- 周杰伦天津演唱会发生意外?经纪公司凌晨回应
- 兰州通报“网民反映污水排入黄河”调查情况
- 电脑蓝屏后键盘鼠标都不亮怎么办
- 工业题材电影创作研讨会在京举办
- 房企动态|金泰樾系三子,金地清峯上、招商雲蘭营销中心开放!
- 电影《不虚此行》北京首映礼:共睹人间璀璨
- 图块排序什么时候出 公测上线时间预告
- 非遗“西秦刺绣”造就锦绣产业丨高质量发展调研行
- 双柏绿孔雀文化季推介会在昆明举行
- steam怎么查账户价值 Steam账号价值计算公式
- 命运方舟托托银发岛岛之心怎么获取
- 怎么让群里发布淫秽的人坐牢
- 沃尔夫小吃店官网在哪下载 最新官方下载安装地址
- 第七史诗瑟琳值得抽吗 第七史诗瑟琳抽取建议
- 如何处理win7专业版安装atl71.dll问题
- 彩虹色彩跑酷什么时候出 公测上线时间预告
- 和平精英特斯拉的工厂展厅在哪 和平精英特斯拉在哪里
- 如何解决提示d3dref.dll缺失报错问题
- 《文字来找茬》公园太离谱通关攻略网民推荐
- 海口:9月10日教师可免费乘坐公交车
- 黑色悖论官网在哪下载 最新官方下载安装地址
- 空中支援射击3D好玩吗 空中支援射击3D玩法简介
- “大人的文具”快闪来啦|文末有福利
- 金融巨头又要裁员!
- 甘肃定西将举办马铃薯大会,产业蓝皮书编纂将启动
- 广东广西局地仍有强降雨 北方冷空气持续发威
- 蚂蚁集团发布金融大模型:用大模型重写金融服务链条关键环节
- 二十国集团领导人第十八次峰会开幕
- 安徽东至尧渡镇:构建基层治理新格局 为幸福生活“加码”
- 如何一键修复nlsdata000a.dll丢失
- 米加世界粉色公寓官网在哪下载 最新官方下载安装地址
- 2-3负王曼昱!陈梦赛后突收坏消息,马琳无奈,或无缘巴黎奥运会
- 武汉黄陂区:清风抚山水 清廉聚民心
- 安徽11选五开奖走势图表 安徽11选五开奖走势图
- 美网魔咒再现!阿卡出局!底线端被打爆,梅总会师德约上演巅峰对决
- 湖北十堰茅箭区:“智”水新模式擦亮绿色生态底色