立即观看会议记录

aminakhatun3521 · 发表于 2025-10-11 14:48:34

互联网档案馆创始人布鲁斯特·卡尔 (Brewster Kahle) 表示：“如果我们能够收集到一些有用且易于使用的文化资料，同时仍然尊重版权所有者，那么我们就可以开始更深入地了解媒体生态系统中正在发生的事情。”

数十亿存档的网页究竟能做什么呢？
可能性无穷无尽。

互联网档案馆网络存档和数据服务总监 Jefferson Bailey 和网络数据工程师 Helge Holzmann 分享了图书馆应该考虑的一些技术问题以及可用的工具，以便向公众提供大量数字内容。

互联网档案馆通过多种方式从网络收集信息
包括全球和域抓取、数据合作以及策展服务。它以多种格式保存电话号码收集不同类型的内容（文本、代码、视听资料）。

了解有关图书馆作为实验室系列的更多信息并注册参加即将举行的会议。
社会科学家、数据分析师、历史学家和文学学者请求从网络档案库获取数据，用于他们的研究计算。机构利用其服务建立各种用途的小型和大型馆藏。贝利表示，有时项目可能很复杂，处理海量数据可能是一项挑战。

互联网档案馆一直致力于审查自
1996 年以来 800,000 个公司主页内容的变化。它还进行了数据挖掘以进行语言分析，对冰岛语、挪威语和爱尔兰语的翻译进行了定制提取。

将数据转化为有用的信息需要数据工程。图书馆员在考虑如何响应数据查询时，应该考虑其技术资源、工作流程和容量。虽然数据工程的生成过程更加复杂，但考虑到其规模、规模和纵向分析能力，其潜力也随之扩大。

“我们每年收到的计算使用数据请求越来越多，”贝利说
如果图书管理员、档案管理员、文化遗产管理员还没有收到这些请求，他们很快就会收到。”

图书馆实验室系列的下一篇：

该系列的下一场网络研讨会将于3月16日举行，届时将重点介绍“档案释放计划”（Archives Unleashed Cohort Program）中的五个创新网络存档研究项目。立即注册。

		自动登录	找回密码
密码			立即注册