通过Amazon Bedrock 数据自动化获取多模态内容洞察,现在全面上线 新闻博客

通过亚马逊Bedrock数据自动化获取多模态内容洞察

关键要点

  • 发版信息 :亚马逊Bedrock数据自动化现已全面推出,支持跨区域推理端点,提供文档、图像、音频和视频等多模态内容的解析。
  • 处理优势 :该服务简化了从非结构化多模态内容中获取有价值洞察的过程,全面提高了文档处理、媒体分析和其他基于多模态数据的自动化解决方案的开发效率。
  • 使用示例 :通过示例代码和配置步骤,展示了如何利用该功能提取重要信息,并提供自定义输出设置的功能。

在当前的科技环境中,许多应用程序需要处理通过不同方式提供的内容。例如,一些应用程序需要解析复杂的文档,如保险索赔和医疗账单,而移动应用则需要分析用户生成的媒体。此外,组织需要在其数字资产上构建语义索引,包括文档、图像、音频和视频文件。然而,从非结构化的多模态内容中提取见解并不容易,需要建立针对不同数据格式的处理管道,经过多个步骤才能获取所需的信息。这通常意味着需要在生产中使用多个模型,并处理成本优化(包括调优和提示工程)、保护措施(例如防止幻觉)、与目标应用的集成(包括数据格式)以及模型更新等问题。

为了简化这一过程,亚马逊推出了 ,该功能能够简化从非结构化多模态内容(如文档、图像、音频和视频)中生成有价值洞察的流程。使用Bedrock数据自动化,可以大大降低构建智能文档处理、媒体分析和其他多模态数据中心自动化解决方案的开发时间和成本。

亚马逊Bedrock的数据自动化功能现在支持跨区域推理端点,并可以在多个 运行。根据预览期收集的反馈,我们还改善了准确性,并为图像和视频添加了徽标识别支持。

使用亚马逊Bedrock数据自动化与跨区域推理端点

在 中,可以看到如何在

的演示中提取文档和视频中的信息。建议您通过控制台演示体验来理解这一功能的工作原理和自定义选项。在本文中,我将更侧重于Bedrock数据自动化如何在您的应用中工作,首先从几个控制台步骤开始,并给出代码示例。

在亚马逊Bedrock控制台的 数据自动化 部分,首次访问时会询问是否确认启用跨区域支持。例如:

![控制台截图](https://d2908q01vomqb2.cloudfront.net/da4b9237bacccdf19c0760cab7aec4a8359010b0/2025/02/18/bda- 删除)

从API的角度来看,InvokeDataAutomationAsync 操作现在需要一个额外的参数(dataAutomationProfileArn),以指定要使用的数据自动化配置文件。这个参数的值取决于区域和您的AWS账户ID:

arn:aws:bedrock:<REGION>:<ACCOUNT_ID>:data-automation-profile/us.data- automation-v1

此外,dataAutomationArn 参数已重命名为 dataAutomationProjectArn ,以更好地反映它包含的项目 [亚马逊资源名称 (ARN)](https://docs.aws.amazon.com/IAM/latest/UserGuide/reference- arns.html?trk=e61dee65-4ce8-4738-84db-75305c9cd4fe&sc_channel=el)。

数据自动化的配置及执行

使用Bedrock数据自动化后,您可以以两种方式配置输出:

  • 标准输出 :提供与数据类型相关的预定义洞察,例如文档语义、视频章节摘要和音频转录。通过标准输出,您仅需几个步骤即可设置所需的洞察。
  • 自定义输出 :允许您使用蓝图指定提取需求,以获得更具针对性的洞察。

通过这些步骤,您可以轻松创建项目并自定义标准输出设置。如选择提取文档的纯文本,而非Markdown格式。对于视频,您可能希望获取完整的音频转录和整个视频的摘要,同时要求每个章节的摘要。

![控制台截图](https://d2908q01vomqb2.cloudfront.net/da4b9237bacccdf19c0760cab7aec4a8359010b0/2025/02/19/bda- 删除)

在自定义输出管理方面,我选择了 自定义输出设置 ,并搜索了 US-Driver-License 示例蓝图。您可以浏览其他示例蓝图以获取更多实例和灵感。

接下来,您可以上传US驾照的图像到S3存储桶,并使用以下样例Python脚本通过 [AWS SDK for Python (Boto3)](https://aws.amazon.com/sdk-for- python/?trk=e61dee65-4ce8-4738-84db-75305c9cd4fe&sc_channel=el) 提取图像中的文本信息。


import boto3

# 配置参数

AWS_REGION = '' BUCKET_NAME = '' INPUT_PATH = 'BDA/Input' OUTPUT_PATH =
'BDA/Output'

# 项目ID和蓝图名称

PROJECT_ID = '' BLUEPRINT_NAME = 'US-Driver-License-demo'

# AWS SDK for Python (Boto3)客户端

bda = boto3.client('bedrock-data-automation-runtime', region_name=AWS_REGION)
s3 = boto3.client('s3', region_name=AWS_REGION)

# 函数定义...

if **name** == "**main** ": main() ```

初始配置中包括用于输入和输出的S3存储桶名称、输入文件在存储桶中的位置、输出结果的路径、用于获取自定义输出的项目ID以及希望在输出中显示的蓝图字段。

通过以上配置运行脚本,并传入输入文件的名称,您就能够看到通过Bedrock数据自动化提取的信息,并可以根据需要调整输出格式。

## 需要了解的事项


现在通过跨区域推理在以下两个AWS地区可用:美国东部(弗吉尼亚北部)和美国西部(俄勒冈)。在这些区域使用Bedrock数据自动化时,可以在这四个区域内进行数据处理:美国东部(俄亥俄、弗吉尼亚北部)和美国西部(加利福尼亚北部、俄勒冈)。所有这些区域均位于美国,以便在同一个地理位置处理数据。我们正在努力在2025年晚些时候为欧洲和亚洲增加更多区域的支持。

定价方面,与预览版相比没有变化,使用跨区域推理时同样适用。有关更多信息,请访问
。

Bedrock数据自动化现在还包含多个与安全、治理和管理相关的功能,例如支持 [AWS密钥管理服务 (AWSKMS)](https://aws.amazon.com/kms/) 的
、通过 
直接连接到您虚拟私有云中的Bedrock数据自动化API。

虽然本文使用Python编写,但Bedrock数据自动化适用于任何 ,例如您可以使用Java、.NET或Rust进行后端文档处理应用程序,使用JavaScript处理图像、视频或音频文件的Web应用,或使用Swift进行提供端用户内容的本机移动应用。使用多模态数据获取洞察从未如此简单。

以下是一些阅读建议,供您进一步了解(包括代码示例):

  * 
  * 
  * 
  * 

* * *

**作者:丹尼洛·波奇亚**  
丹尼洛与初创企业和各类公司的合作,致力于支持他们的创新。在担任亚马逊网络服务(AWS)首席布道师(EMEA)期间,他利用自己的经验帮助人们实现创意,专注于无服务器架构和事件驱动编程,以及机器学习和边缘计算的技术和商业影响。

Leave a Reply

Required fields are marked *