导读:AI生成的合成照片也许很快替代Shutterstock和Getty等传统图片站。不算标题党,它是有原因的,请看内容。
人工智能生成的摄影图库技术已经成熟,可以取代Shutterstock等图片站
轻松提取 PDF和图像的问答内容,可以节省数百万美元
让我们现在开始。
AI 提取内容
DocQuery 就是一个典型的产品和例子。
DocQuery 是一种 AI 工具,可以在几秒钟内读取 PDF 并自动提取数据,包括关键文本、问题,甚至是调查中的数据。
它通过自然语言界面运行,使用起来直观,而且是免费的:该模型托管在HuggingFace上,你可以根据需要下载和扩展它。
从财务 PDF 中自动生成关键点摘要:指标、关键点、数字等。
按类型(例如发票、合同、法律文件等)对文档进行分类,以便轻松转发到正确的部门。
通过提取关键文本和图形,然后将它们重新排列到新模板中,灵活地重新格式化 PDF。
从客户调查中提取数据,以便生成可操作的决策。
即使经验丰富的专业人员也需要一个小时或更长时间才能完成这些任务中的其中一项。但通过向 AI 管道添加灵活的数据提取,人们可以在几秒钟内就可以拿到相同的结果。
例如,我们在1SecondCopy实现了一个(非常)简单的合同管理系统,每周可以节省 60-90 分钟。
我们有时一天会收到三四份合同,它们通常是 NDA、工作协议等文档。然而,解析法律术语需要相当多的时间。
但是对于DocQuery,我只需要问一个问题,比如“支付多少钱?” 或“付款条件是什么?”然后,在几秒钟内得到答复。
AI生成的摄影图库很快将取代 Shutterstock等图片库
无需策划特定的搜索词,或花费数小时从一个平台跳到另一个平台。
你现在只需点击一张图片,它就会拉出数百个相似的图片供人们来选择。最后,你将注意力集中在想要的图片上即可,可无需输入搜索词组。
这只是 AI 图像工具可能性范围的又一步。随着现在许多方面与真正的 DSLR 摄影无异的稳定质量传播,股票证券媒体行业很快就会被AI深刻影响。
使用或训练类似于Lexica 的 Aperture的模型。这里提示一些细节,如果你选择训练自身,并对 DSLR 照片进行微调。
采集 Shutterstock 或 Getty 用来创建关键字列表。100K 关键字或更多是最佳的。
现在已经有了一个关键字列表,再生成一组风格短语列表:镜头类型、光圈和其他摄影术语。想想Sigma 30mm f1.4、微距、散景等短语。
通过使用不同风格的短语遍历每个关键字,生成一百万或更多图像。例如,如果一个关键字是smiling woman on street,那么一代人可能是smiling woman on street,sigma 30mm f1.4。另一个可能是smiling women on street。
将图像、文字嵌入等存储在某个地方,比如AWS或者其它云存储平台。也可以跳过文本/图像嵌入步骤,并通过另一个模型运行生成图像,该模型为每个图像生成标题或标签(以加快搜索速度)。
你现在拥有一个包含更多图像的后端。然后继续需要做,改善前端的客户用户体验:通过更快地产生结果、创建更好的图片设计等。
最后,选择 Netflix 商业模式路线收取人人负担得起的月度订阅费用。在普通人触手可及的最先进的图像生成器的未来,传统图片售卖模型将不再可行。
在我和大家分享的时候,也许有人开始行动了。而第一个利用这一优势的人将看到巨大的利基效应。
作者:大雄
参考:
https://twitter.com/sharifshameem/status/1593393961980162048
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。