17611538698
webmaster@21cto.com

亚马逊首席技术官 Werner Vogels 推出基于 Rust 的媒体摘要工具

资讯 0 468 2024-07-16 11:13:05

图片

亚马逊首席技术官 Werner Vogels 最近推出了一款名为 Distill CLI 的工具,这是一款用 Rust 编写的个人项目。该工具已经开源,它利用 Amazon Transcribe 和 Amazon Bedrock 直接从命令行来生成录音摘要。

Distill CLI 同样基于开源工具 Amazon Bedrock Audio Summarizer,这款新的 CLI 工具提供了一种自动化方式来转录和汇总媒体文件,使用 Amazon S3、AWS Lambda、Amazon Transcribe、Amazon Bedrock 和 AWS CDK 来管理项目的基础设施。

Distill CLI 由 Rust 应用程序总结并提取日常会议中的重要细节,由 Vogels 及其在亚马逊的团队开发。

Vogels 在今年早些时候介绍了 Distill CLI,他在《黑客入侵,让团队会议变得更好》一文中首次提到了这个项目,强调了其在改进笔记记录过程中的应用。

图片

Distlll CLI 输出示例。来源:All Things Distributed 博客

Vogels 这样写道:

“我一直在寻找可以帮助我改进自己的笔记记录过程的工具和策略(例如康奈尔方法)。虽然我通常更喜欢用笔和纸(因为事实证明它有助于记忆和综合),但不可否认的是,技术可以帮助提高我们积累的能力。在会议等情况下尤其如此,因为积极参与和同时做笔记可能会互相冲突。”

图片

Distill 的第一个版本。来源:All Things Distributed 博客

Vogels 还分享了该项目早期阶段做出选择的细节,后来他对该项目的目标进行确定,利用人工智能来转录和总结虚拟团队会议:

我们用 Rust 重写了一个 Lambda 函数,发现冷启动速度提高了 12 倍,内存占用减少了 73%。在不知不觉中,我开始思考其它方法,让整个过程在我的用例中更加高效。

他强调,虽然最初的概念验证将媒体文件、便笺和摘要存储在 S3 存储桶中,但发布后 Distill CLI 会将便笺和摘要保存在内存中,这样减少了写入 S3 的次数。简单的 UI 提供状态更新并通知用户可能产生的故障,允许在不离开命令行的情况下上传媒体并监控摘要过程。

Distill CLI 支持将摘要输出到终端并且输出为 Word 文档、文本文件、Markdown 和 Slack 消息。此外该工具还可以处理Amazon Transcribe 支持的任何语言的音频文件。

尽管 Distill CLI 源于团队需求,但 Vogels 坦承提道,他的目标是用一门新语言挑战自己,这证明了修修补补是一种有效的学习方式,并且能够保持好奇心:

“我之前就说过,你必须要努力工作。否则一切都是废话。随着越来越多的开发者选择 Rust 来解决大规模难题,我觉得是时候亲自动手了。”

他承认 Rust 可能具有的挑战性:

“前期,你会遇到很多阻力,有时当您真正想做的只是进入 IDE,并开始构建时,这会很困难。但是一旦你进入了另一端,就有巨大的潜力来加快速度。请记住,构建系统、服务或应用程序的成本与运营成本相比较微不足道,因此你应该不断审查构建方式。”

Pyle Cloud Technologies 联合创始人兼首席执行官 Benjamen Pyle 评论道:

“非常高兴看到亚马逊开始支持、鼓励和投资 Rust。它是一种非常适合很多用例的出色编程语言。从 CLI 工具、嵌入式系统、Web API 到无服务器工作负载,无所不包”。

一名用户名为 erikhopf 的网友在 Hacker News 上补充道:

“我特别喜欢将学习 Rust 与在亚马逊编写文档进行比较,这是一个充满摩擦的雷区”。

Distill CLI 已经在 GitHub 上就绪,它根据 Apache 2.0 许可证提供分发。

项目地址:https://github.com/awslabs/distill-cli/

作者:万能的大雄

参考:

https://www.allthingsdistributed.com/2024/06/introducing-distill-cli.html

评论