导读:
开源软件或算法意味着它可以公开访问,任何人都可以查看,拉取以及修改和分发 。
Twitter 和它的所有者在今天正式向所有用户开放推荐推文的算法。
推特所有者马斯克在本周五发表推文:“算法将在太平洋时间中午开放源代码”。
马斯克认为,“Twitter 2.0 是互联网中一座城邦,我们认为有责任提高平台的透明度”。
Twitter 官方同时也表示:“我们的目标是尽可能提高透明度,同时排除任何会危及用户安全和隐私的代码,并保护我们的平台免受不良行为者影响”。
Twitter 已完全将选择哪些推文显示的代码,公开在 GitHub 上发布。该公司在 GitHub 上新建了 2 个库,开源了包括“为你推荐”(For You)标签页的推文推荐算法在内的诸多源代码。
GitHub:https://github.com/twitter/the-algorithm
它分解了算法在确定要在 For You 时间轴中显示哪些推文时所查看的内容以及它如何对它们进行排名和过滤。
以下引用 Twitter 关于此次开源的博客文章:
“推荐管道由三个主要阶段组成。” 首先,它收集“来自不同推荐来源的最佳推文”,然后使用“机器学习模型”对这些推文进行排名。最后它会过滤掉来自你已屏蔽人的推文、你已经看过的推文或对工作不安全的推文,然后再将它们放在你的信息流上。
例如,它指出第一步会查看大约 1,500 条推文,目标是让 For You 时间线中大约有 50% 的推文来自你关注的人(称为“网络内”),50% 的推文来自“你不关注的“网络外”帐户。它还表示排名旨在“针对积极参与进行优化(例如点赞、转推和回复等)”,并且最后一步将尝试确保你不会看到来自同一个人的过多推文。
Twitter CEO 伊隆·马斯克承诺此举已经有一段时间。
2022 年 3 月 24 日,在他收购该网站之前,他就 Twitter 的算法是否应该开源对他的追随者进行了民意调查,大约 83% 的回复说“应该”。2 月,他承诺将在一周内完成,然后将截止日期推迟到本月早些时候的 3 月 31 日。
马斯克在推特上表示,周五发布的是“大部分的推荐算法”,并表示其余的将在未来时间继续发布。
他说,希望“独立的第三方应该能够合理准确地确定可能向用户展示的内容。” 在讨论算法发布的 Space 空间中,他说计划是让它成为“互联网上最难玩的系统”,并让它像 Linux 一样健壮,Linux 可能是最著名和最成功的开源项目。“总体目标是最大限度地利用未后悔的用户分钟数,”他补充道。
马斯克也希望自己的听众做好准备,有可能看到算法时会感到失望(当然,这是在假设人们实际上会理解复杂的代码)。
他说它“过于复杂且内部未完全理解”,人们会“发现许多愚蠢的事情”,但他承诺会在发现问题时加以解决。“一开始提供代码透明度会令人难以置信的尴尬,但它会让推荐内容的质量快速提高,”
代码透明度(用户将能够看到为时间线选择推文的机制)和代码开源(社区实际上可以提交自己的代码可供在其他项目中使用)之间存在差异。
Twitter 表示每个人可以提交拉取请求,这些请求最终会出现在其代码库中。
在GitHub 的自述文件说:“我们邀请社区提交 GitHub 问题,并请求提出改进推荐算法的建议。” 它担承说 Twitter 仍在构建“管理这些建议并将更改同步到自己内部存储库的工具”。
马斯克的 Twitter 承诺会做很多事情(比如在做出重大决定之前对用户进行民意调查),但它并没有坚持,这次看它是否真的接受任何社区代码。
提高其建议透明度的决定并非空穴来风。马斯克一直公开批评 Twitter 的前任管理层如何适度和推荐处理,并精心策划了一系列他声称会揭露该平台“言论自由压制”的故事。
“代码是开源的,社区可以实际提交自己的代码以供研究,并可以在其它项目中使用该算法。”
作者:场长
本文为 @ 场长 创作并授权 21CTO 发布,未经许可,请勿转载。
内容授权事宜请您联系 webmaster@21cto.com或关注 21CTO 公众号。
该文观点仅代表作者本人,21CTO 平台仅提供信息存储空间服务。