Shadow“Archive”声称其几乎抄袭了Spotify的所有音乐。 - 币界网

安娜的档案 以使盗版电子书和学术论文可搜索而闻名的影子图书馆本周末宣布了一项可能是历史上规模最大的音乐盗版行动:“我们备份了 Spotify。” 该组织声称他们从Spotify抓取了8600万个音频文

安娜的档案 以使盗版电子书和学术论文可搜索而闻名的影子图书馆本周末宣布了一项可能是历史上规模最大的音乐盗版行动:“我们备份了 Spotify。”

该组织声称他们从Spotify抓取了8600万个音频文件,占该平台用户实际收听内容的99.6%。总大小略低于300TB,通过批量BT下载传播。

Spotify对此很不高兴。一位发言人告诉 广告牌 “第三方抓取了公开元数据,并使用非法手段绕过数字版权管理(DRM),访问了该平台的部分音频文件。” 请注意措辞上的谨慎:“部分”音频文件。Anna's Archive 称有 8600 万个音频文件。Spotify 尚未证实这一数字。该公司还将该组织称为…… “反版权极端分子” 他们之前曾盗版过 YouTube 的内容。

那么,除了剽窃 Spotify 和主要依靠版税收入的录音艺术家之外,他们究竟得到了什么?

这些数字

Anna's Archive 声称拥有 Spotify 曲库中 2.56 亿首歌曲中 99% 的元数据,其中包括 8600 万首真正重要的歌曲(也就是人们经常播放的歌曲)的音频文件。仅元数据数据库就包含 1.86 亿个唯一的 ISRC(国际标准录音代码)。作为对比, MusicBrainz 最大的 合法的 开放音乐数据库,拥有约 500 万首曲目。Anna's Archive 刚刚构建了一个规模是其 37 倍的数据库。

热门歌曲以原始的 OGG Vorbis 格式(160 kbps)保留,未进行重新编码,因此音质无损。不太热门的歌曲则被压缩成 OGG Opus 格式(75 kbps)以节省空间。该团队使用 Spotify 的流行度指标来确定优先抓取哪些歌曲,重点关注流行度得分高于零的歌曲。

Spotify 2.56 亿首歌曲中,超过 70% 的歌曲流行度得分为零,几乎无人问津。排名前 1 万的歌曲流行度得分在 70 到 100 之间。只有约 21 万首歌曲(约占曲库的 0.1%)流行度得分达到 50 或更高。而这 0.1% 的歌曲却占据了绝大部分的收听量。

目前Spotify播放量最高的三首歌分别是:Lady Gaga和Bruno Mars的《Die With A Smile》(30.7亿次播放)、Billie Eilish的《BIRDS OF A FEATHER》(31.3亿次播放)以及Bad Bunny的《DtMF》(11.2亿次播放)。这三首歌的总播放量就超过了播放量最低的2000万到1亿首歌的总和。

换句话说,Spotify 基本上就是一个歌曲坟场,里面堆满了无人问津的歌曲。Spotify 决定不把这个“坟场”(完整的曲库)存档——因为仅仅占收听量 0.04% 的内容,就需要额外 700 TB 的存储空间。而且,其中很多都是人工智能生成的垃圾歌曲。

数据中的奇怪之处

安娜档案馆发表了对他们发现的详尽分析。其中一些结果在意料之中,另一些则令人匪夷所思。

歌曲时长明显集中在 2 分钟、3 分钟和 4 分钟这几个时间段。该团队表示他们也不知道原因。自 2015 年以来,专辑发行量呈指数级增长,仅 2023 年就预计将发行超过 1000 万张专辑——这很可能是由人工智能生成和自动上传驱动的。

电子/舞曲是艺术家数量最多的音乐类型(520,075),其次是摇滚(370,179)和世界/传统音乐(202,529)。

另外,信不信由你,歌剧、合唱和室内乐这三个子流派的艺术家数量最多。

音频特征数据显示,响度与能量密切相关(这并不令人意外),BPM 值集中在 120 左右,呈正态分布,大多数曲目的“人声”和“乐器”得分较低——这意味着人声占主导地位。C 大调和 G 大调是最常见的调。Spotify 上约有 13.5% 的曲目被标记为包含露骨内容。

为什么要这样做?

Anna's Archive 将此举定义为保存而非盗版。“我们认为我们在这里可以发挥作用,建立一个主要以保存为目标的音乐档案馆,”该组织在其博客文章中写道。他们认为,现有的音乐存档工作过于关注流行歌手和发烧级音质格式(无损 FLAC),导致一些冷门音乐一旦平台改变政策或关闭,就很容易消失。

这话不无道理。Spotify 控制着 2.56 亿首歌曲,可以删除内容、更改授权条款,甚至彻底消失。而去中心化的种子分发方式则创造了冗余机制,任何单一实体都无法将其关闭。数据已经分散在全球数千个种子节点上。

但说实话,这其实也是盗版。Spotify 给艺术家的报酬介于……之间。 0.003美元和0.005美元 按播放次数计算。根据 Dittomusic 的 Spotify 收入计算器,100 万次播放可以为艺术家带来 4,370 美元的版税。通过种子文件免费分发,甚至连这点微薄的收入都拿不到。

这两件事同时成立。

法律界的流星即将到来

安娜档案馆已面临越来越大的法律压力。比利时已发出禁令,最高罚款可达50万欧元。 2025年7月 英国于2024年12月获得高等法院的封锁令。德国主要互联网服务提供商于2025年10月封锁了该网站的主要域名。根据谷歌自身的透明度报告,谷歌已将其移除。 7.49亿 Anna 的存档 URL 来自搜索结果——这占搜索引擎自 2012 年以来收到的所有 DMCA 删除请求的 5%。

互联网档案馆——一个合法的非营利组织—— 达成和解 此前,出版商因“Great 78 Project”项目而向互联网档案馆索赔6.21亿美元,该项目旨在将过时的78转唱片数字化。而Anna's Archive最近又收录了31000首曲目,数量是之前的31000倍,而且全部都是热门歌曲。音乐行业的法律回应会让互联网档案馆的案例显得微不足道。

在 Hacker News 评论者们就Spotify的便捷性展开了辩论,探讨该档案库对消费者是否真的有用。有人指出,Anna's Archive已经以数万美元的价格提供“企业级”图书档案访问权限——本质上是将批量数据出售给人工智能公司用于训练。

目前,只有元数据已完全发布。音频文件正通过批量种子逐步发布,首先发布的是最热门的曲目。Anna's Archive 请求用户帮忙做种,并表示如果需求足够,他们可能会添加单个文件的下载。

诉讼很可能即将到来。唯一的问题是,存档能否在诉讼中幸存下来——但到了现在,这可能已经无关紧要了。数据已经存在于网络上,分布在成千上万个节点上,这些节点无法被集中关闭。这正是BT下载的意义所在。

微信里点“发现”,扫一下二维码便可将本篇文章分享至朋友圈

发布者:币下载 转转请注明出处:https://www.baidudian.cn/286864.html

(0)
今日快讯的头像今日快讯
上一篇 2025年8月16日 上午10:31
下一篇 2025年8月16日 上午10:41

相关推荐

联系我们

QQ:11825395

邮件:admin@baidudian.cn

联系微信
联系微信
免责声明:本站为开放的资讯分享平台,仅代表作者个人观点,与平台立场无关,且不构成任何投资理财建议。