??:微软的ProjectSilica提供强大的千年存储

Ars 周二与英国剑桥微软研究院的首席研究员 Ant Rowstron 博士就一项名为 Silica 的创新冷藏项目进行了交谈 。Silica 旨在取代磁带和光学档案光盘,成为大规模(非常)长期冷存储的首选介质 。微软研究院正与电影巨头华纳兄弟合作,后者对降低成本和提高其自有冷库项目的可靠性很感兴趣 。


??:微软的ProjectSilica提供强大的千年存储

文章插图


所讨论的介质是一块高纯度玻璃,其上 用飞秒激光蚀刻了体素 。每个体素以延迟和角度这两个属性存储多个位,这些属性又可以使用显微镜成像和偏振光读取 。通过将激光聚焦到块本身内所需的深度,体素可以在 2 毫米深的玻璃片中写入 100 层或更深的层 。

目前,Silica 的读取和写入速度都不尽如人意——去年蚀刻超人大约 76GB 的数据需要大约一周的 时间,而 Rowstron 估计重新读取数据需要大约三天的时间,此后取得的进展 。当然,该技术仍处于起步阶段,预计写入和读取所需的时间将大大减少 。Rowstron 说,他仍然不希望有人会尝试直接从 Silica 唱片中真正扮演 超人——但这不是它的目的 。

真正的长期数据存档是一个非常昂贵的提议 。当我在大学时,我参加了我大学档案部门的一个研究项目——该部门需要一个数据库应用程序来索引和跟踪其数字媒体收藏,这在很大程度上是为了能够预算和执行档案工作预期更新周期内的更新操作 。其较旧的模拟音频和视频磁带记录需要数字化,其光学 CD 和 DVD 记录需要读取、检查完整性并在原始光盘分层之前刻录到新媒体上 。

这种档案更新周期在任何重大规模上都会迅速变得令人生畏 。如果您假设有 10,000 张 CD 和一个由三到四名拥有 CD-RW 驱动器和大量光盘的本科生组成的团队,那么您将需要一年多的全职工作来更新它们 。(华纳兄弟的预算比我母校图书馆的珍稀馆藏部门要高,它以严格的三年周期迁移自己的数字档案数据 。)

更糟糕的是,刻录 CD 的寿命通常很短——它们很容易在五年后就开始出现故障,所以至少应该经常测试它们,如果没有“无论是否需要”刷新 。将光盘存放在 5C/41F 和 30% 的相对湿度下可以显着延长光盘的使用寿命,但这会显着增加存储和维护的额外费用 。

这是 Project Silica 准备解决的问题 。尽管目前读取或写入的速度相当慢,但 Silica 的介质(不超过或低于高纯度玻璃)与磁带、光盘甚至纸张的故障模式均不相同 。Project Silica 玻璃块不是复合介质;没有像 CD、DVD 或蓝光那样会磨损的塑料外壳,也不会从磁带或硬盘的表面物理丢失磁性介质 。

预计二氧化硅几乎可以在任何温度、湿度和化学环境中存活数千年——它实际上只是玻璃,玻璃的物理和化学特性非常清楚 。我们只能使用加速老化技术猜测更复杂的制造材料(磁带、磁盘等)的特性,但已有数千年历史的玻璃制品可供研究 。

除了媒体已经令人印象深刻的抗退化能力——它基本上可以预期除了用锤子敲击它之外的任何东西——该项目使用具有前向纠错功能的真实文件系统来进一步确保存储的数据免受损坏或丢失 。此外,标题、索引、日期等元数据可以以人类可读的文本蚀刻到每个 Project Silica 块的表面 。

正如The Mote in God's Eye 的粉丝们已经知道的那样,对于任何预计将持续数千年的数据存储方法,必须回答剩下的一个问题——当围绕存储介质的技术和文化背景崩溃时会发生什么?Silica 也通过使用初始的“ground truth”轨迹解决了这个问题 。该团队正在使用机器学习算法来重新读取 Silica 的数据,如果这些训练过的算法丢失,新算法可以在“地面实况”轨道上非常快速地进行训练,这会教他们如何解释其余的数据 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: