该功能由Amazon Bedrock的大语言模型提供支持2023年12月8日智东西11月29日拉斯维加斯报道,北京时分11月30日,正在年度“云盘算春晚”AWS re:Invent大会举办的第三天,AWS数据与AI副总裁Swami Sivasubramanian公布中心演讲,公告AWS助助客户构修天生式AI使用的一系列器械与技巧。
除了正在Amazon Bedrock平台揭晓更众第三方和自研根本模子、说话模子外,Sivasubramanian还分享了AWS助助客户负负担且愈加轻松地构修、教练和布置天生式AI模子的众项革新举措。
Sivasubramanian说,构修天生式AI使用离不开4个因素:根本模子、诈骗数据的隐私境况、易用的器械、特制的呆板研习根本步骤。
他将Amazon Bedrock平台称作是“正在根本模子和大说话模子上构修和扩展天生式AI使用的最纯洁体例”,供应包罗第三方模子和自研模子正在内的广大模子遴选。进步10000个客户正正在应用Amazon Bedrock。
向量是定制天生式AI使用的环节。下图是不应用与应用向量嵌入的搜求结果比照,向量嵌入有助于降低搜求结果凿凿性。
众种模子混杂增进了搜求体例的繁复性,会影响客户体验。为此,AWS推出Amazon Titan众模态嵌入,助助客户为最终用户供应更凿凿且与上下文干系的搜求和推选体验。
“众模态”是指模子可认为图像和文本天生嵌入,并将其存储正在客户的矢量数据库中,最终用户可能应用文本、图像或图文混杂提交搜求查问。
该模子将众达128个象征的图像和短英文文本转换为嵌入,从而捕捉数据之间的语义和闭连;默认景况下会天生1024维的向量。
Amazon Titan文本嵌入可将文本翻译成数值显露,援助语义搜求、文本解说和聚类,援助进步25种说话。
Amazon Titan Text Lite和Amazon Titan Text Express两款大说话模子均已可用,援助总结、翻译、对话、代码天生等厚实的文本干系职业,可能助助优化凿凿性、功能与本钱。
此中Lite高度可定制,性价比高,最大上下文长度为4096个token,出格适合英语职业,可能对作品总结、写文案等职业举办微调。
Express应用周围更广大,最大上下文长度为8192个token,适合怒放式文本天生、对话谈天等职业,并援助检索加强天生(RAG)劳动流。
正在图像天生宗旨,AWS推出Amazon Titan图像天生模子预览版。用户输入文字,就能竣工扩展或转换配景、调解主体宗旨、更动图像尺寸等图像编辑条件。
该模子由高质料、众样化的数据教练而成,可能阐明繁复的提示词,创修更凿凿的输出,比方具有宽恕性属性和有限失真的传神图像。企业还可能用专稀有据来定制模子。
Sivasubramanian夸大说,Titan图像天生模子援助负负担的AI应用,其天生的完全图像都包蕴一个不成睹的水印,通过供应一种认真的机制来识别AI天生的图像,助助省略谬误音信传布。
Sivasubramanian分享道,Amazon Bedrock援助用私稀有据安好地定制根本模子,该平台供应的定制Amazon Titan模子新功用包罗微调、继续预教练、RAG。
继续预教练可能助助模子正在原始教练除外,通过积蓄更众的牢固学问和合适性,变得愈加特定于范围。通过继续预教练,企业可能正在具有客户统制密钥的安好托管境况中应用本身的未标注数据来教练模子。
Amazon Bedrock学问库已周至怒放。通过学问库,企业可能安好地将Amazon Bedrock中的根本模子与自稀有据毗连起来,以用于检索加强天生,访谒附加数据以天生更干系、更全部和更凿凿的呼应,而无需络续从头教练根本模子。
该学问库可统制初始向量存储配置,惩罚嵌入和查问,并供应坐蓐检索加强天生使用序次所需的源属性和短期内存。企业还可能定制检索加强天生劳动流以满意特定的用例需求,或者将检索加强天生与其他天生式AI器械及使用序次集成。
Agents for Amazon Bedrock通过应用根本模子的推理才能,将用户哀告的职业分析为众个措施,创修编排筹划,然后挪用公司API和应用检索加强天生访谒学问库来推广该筹划,助助用户加快天生式AI使用拓荒。
其对编排的革新掌握功用变得更强,对头脑推理链也具有更好的可睹性。拓荒职员应用跟踪功用可此后跟踪推广筹划时应用的推理,查看营业流程中的中心措施,并据此对题目举办滞碍驱除;还可能访谒和篡改agent自愿创修的提示词,进一步加强终端用户体验。
Agents正在用心于特定职业时外示更好,指令越大白、可用的API越鸠集,根本模子就越容易推理并确定精确的措施。
AWS天生式AI革新核心收到很好的反应,即将援助定制Anthropic Claude模子的筹划。
四、5项Amazon SageMaker新功用:让构修与布置天生式AI模子更轻松
从搜求数据、创修聚类(clusters)、散布模子教练、checkpoint模子到修复硬件题目,教练根本模子的进程充满离间。对此,Amazon SageMaker呆板研习平台供应了遮盖推理、革新和MLOps的一系列革新功用。
Sivasubramanian布告了全托管任事Amazon SageMaker的5项新功用,让客户可能更轻松地构修、教练和布置天生式AI模子。
1)SageMaker HyperPod:自愿正在数百或数千个加快器之间分派教练劳动负载,助助客户将模子教练时分缩短众达40%。
2)SageMaker Inference:援助客户将众个模子布置到统一个AWS实例,更好地诈骗底层加快器并低重布置本钱和延迟。
3)SageMaker Clarify:助助客户评估、比拟、遴选适合其特定用例的最佳模子,凭据遴选的参数来援助负负担地应用AI。
4)两项SageMaker Canvas加强功用:无需编写任何代码即可构修自界说模子,让客户可能更轻松、更速地将天生式AI集成到劳动流程中。
Sivasubramanian说,强壮的数据根本是天生式AI的环节。AWS供应了数据根本的全套任事。
向量搜求是呆板研习范围的一种新兴技巧,通过应用隔断或似乎性胸怀比拟向量显露,来找到与给定命据似乎的数据点。这种要领能竣工无误的音信检索,对构修天生式AI使用出格有效。
AWS最新正式揭晓的Amazon OpenSearch Serverless向量引擎是一种纯洁、可扩展且高功能的似乎度搜求功用。
向量引擎援助通过正在统一查问中组合向量搜求和全文搜求,来优化和调解混杂搜求的结果,让用户无需统制底层向量数据库根本步骤,即可轻松构修呆板研习加强搜求体验和天生式AI使用序次,几毫秒可存储、更新和搜求数十亿个稀有千个维度的向量嵌入。
AWS还布告Amazon DocumentDB和DynamoDB内置的向量搜求功用周至可用,援助用户正在文档数据库中以毫秒级响当令间存储、索引和搜求数百万个向量,并推出Amazon MemoryDB for Redis向量搜求功用的预览版。
剖判数据库引擎Amazon Neptune Analytics也正式揭晓,更易出现图形与向量之间的闭连,还可能应用它加强根本模子的提示,让图形数据剖判更高效简明。发端基准测试标明,Neptune Analytics从Amazon S3加载数据的速率比现有的AWS管理计划速80倍。
AWS还推出了Amazon OpenSearch Service zero-ETL与Amazon S3集成的预览版,使客户可能直接查问其运营数据,低重复制数据或统制众个剖判器械的操作繁复性,避免过众反复统制,省略了本钱和操作时分。
其它,AWS揭晓了由天生式AI援助的Amazon DataZone自愿化功用预览版。
该功用由Amazon Bedrock的大说话模子供应援助,可能使古代劳动聚集型数据编目进程自愿化,天生数据资产及其形式的精细刻画,并发起剖判用例,从而大大省略为结构数据供应上下文所需的时分,让数据编目和出现进一步简化。
为了助助客户和团结伙伴正在不共享原始数据的景况下使用呆板研习模子,AWS推出AWS Clean Rooms ML预览版。该功用可助助企业及其团结伙伴正在无需互相复制或共享原始数据的景况下配合教练模子,众则可省俭数月时分。
AI为优化数据根本供应了更众燃料,使得数据统制更容易、更好用、更直观、更易访谒。
AWS昨日揭晓的天生式AI助手Amazon Q可能援助拓荒者全性命周期,凭据企业营业举办定制,通过毗连到企业的音信库、代码、数据和企业体系,向拓荒职员和IT专业职员供应对话问答、优化Amazon EC2实例遴选、直接正在掌握台中驱除和管理谬误、汇集滞碍驱除协助等功用,使其无论是构修使用序次、探讨最佳实习、编程依旧管理题目,都能敏捷访谒谜底并取得思法上的助助。
启用AI驱动扩展和优化的Amazon Redshift Serverless,会凭据查问繁复性、频率、数据集巨细等维度主动和自愿扩展容量,供应均衡价值与功能的优化。
Amazon Redshift查问编辑器中的Amazon Q天生式SQL预览版可凭据自然说话提示天生SQL发起,让编写有用的SQL查问更高效。数据库统制员还可能授权模子应用AWS帐户中完全效户的查问史籍纪录来天生更干系的SQL语句。
AWS Glue数据质料功用预览版即将揭晓,用呆板研习来检测统计特地景况,助助降低数据质料,无需写代码即可深远明白数据质料题目、数据质料评分、可用于继续看守特地的轨则发起。
营业用户常常需求分享其数据出现。对此,AWS推出QuickSight的Amazon Q预览版。它可能助助营业用户创修款式美好的阐发来刻画数据,正在QuickSight中轻松与他人共享文档、幻灯片款式的视觉效率、图像与文本,还可能助助阐明仪外板上的环节亮点、供应数据问答任事。
正在Sivasubramanian看来,天生式AI仍处于早期阶段,依赖于整洁的数据和人工输入技能得到胜利。数据、天生式AI和人类三者相辅相成,配合为客户供应革新和更好的体验。
好比Amazon Bedrock创修使用序次,用户输入自然说话就能搜求告竣项方针精细措施、原料、器械和发起的列外,Code Whisperer供应了AI驱动的编程发起,Amazon Q通过饰演AWS及贸易专家脚色来加快坐蓐力。
由AWS委托、Morning Consult对美邦贸易头目代外性样本举办的一项新观察显示,跟着越来越众的公司和结构将天生式AI使用于其营业,负负担的AI变得越来越紧张。77%的受访者显露他们熟习负负担的AI,47%的受访者筹划正在2024年对负负担的AI举办比2023年更众的投资。
末了,针对正在拓荒完全阶段都至闭紧张的模子评估,AWS推出Amazon Bedrock模子评估预览版,为拓荒职员供应用于构修天生式AI使用序次的评估器械,使其可能评估、比拟和遴选合用于自家用例的最佳根本模子。
转载请注明出处。