亚马逊首席技术官 Werner Vogels 最近推出了一款名为 Distill CLI 的工具,这是一款用 Rust 编写的个人项目。该工具已经开源,它利用 Amazon Transcribe 和 Amazon Bedrock 直接从命令行来生成录音摘要。
Distill CLI 同样基于开源工具 Amazon Bedrock Audio Summarizer,这款新的 CLI 工具提供了一种自动化方式来转录和汇总媒体文件,使用 Amazon S3、AWS Lambda、Amazon Transcribe、Amazon Bedrock 和 AWS CDK 来管理项目的基础设施。
Distill CLI 由 Rust 应用程序总结并提取日常会议中的重要细节,由 Vogels 及其在亚马逊的团队开发。
Vogels 在今年早些时候介绍了 Distill CLI,他在《黑客入侵,让团队会议变得更好》一文中首次提到了这个项目,强调了其在改进笔记记录过程中的应用。
Distlll CLI 输出示例。来源:All Things Distributed 博客
Vogels 这样写道:
“我一直在寻找可以帮助我改进自己的笔记记录过程的工具和策略(例如康奈尔方法)。虽然我通常更喜欢用笔和纸(因为事实证明它有助于记忆和综合),但不可否认的是,技术可以帮助提高我们积累的能力。在会议等情况下尤其如此,因为积极参与和同时做笔记可能会互相冲突。”
Distill 的第一个版本。来源:All Things Distributed 博客
Vogels 还分享了该项目早期阶段做出选择的细节,后来他对该项目的目标进行确定,利用人工智能来转录和总结虚拟团队会议:
我们用 Rust 重写了一个 Lambda 函数,发现冷启动速度提高了 12 倍,内存占用减少了 73%。在不知不觉中,我开始思考其它方法,让整个过程在我的用例中更加高效。
他强调,虽然最初的概念验证将媒体文件、便笺和摘要存储在 S3 存储桶中,但发布后 Distill CLI 会将便笺和摘要保存在内存中,这样减少了写入 S3 的次数。简单的 UI 提供状态更新并通知用户可能产生的故障,允许在不离开命令行的情况下上传媒体并监控摘要过程。
Distill CLI 支持将摘要输出到终端并且输出为 Word 文档、文本文件、Markdown 和 Slack 消息。此外该工具还可以处理Amazon Transcribe 支持的任何语言的音频文件。
尽管 Distill CLI 源于团队需求,但 Vogels 坦承提道,他的目标是用一门新语言挑战自己,这证明了修修补补是一种有效的学习方式,并且能够保持好奇心:
“我之前就说过,你必须要努力工作。否则一切都是废话。随着越来越多的开发者选择 Rust 来解决大规模难题,我觉得是时候亲自动手了。”
他承认 Rust 可能具有的挑战性:
“前期,你会遇到很多阻力,有时当您真正想做的只是进入 IDE,并开始构建时,这会很困难。但是一旦你进入了另一端,就有巨大的潜力来加快速度。请记住,构建系统、服务或应用程序的成本与运营成本相比较微不足道,因此你应该不断审查构建方式。”
Pyle Cloud Technologies 联合创始人兼首席执行官 Benjamen Pyle 评论道:
“非常高兴看到亚马逊开始支持、鼓励和投资 Rust。它是一种非常适合很多用例的出色编程语言。从 CLI 工具、嵌入式系统、Web API 到无服务器工作负载,无所不包”。
一名用户名为 erikhopf 的网友在 Hacker News 上补充道:
“我特别喜欢将学习 Rust 与在亚马逊编写文档进行比较,这是一个充满摩擦的雷区”。
Distill CLI 已经在 GitHub 上就绪,它根据 Apache 2.0 许可证提供分发。
项目地址:https://github.com/awslabs/distill-cli/
作者:万能的大雄
参考:
https://www.allthingsdistributed.com/2024/06/introducing-distill-cli.html
本文为 @ 万能的大雄 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。