顶部右侧文字
产品分类
摩登4注册网站
当前位置:网站首页 > 摩登4注册网站 > 正文

未保存的数据,历史记录消失

作者:发布时间:2019-12-30分类:摩登4注册网站阅读:10 ℃评论:0 评论

  欢迎使用“创造”微信订阅号:sinachuangshiji

  文字/普通酱料编辑/好了,你别再说话了

  来源:放大镜(ID:guokr233)

  “洛阳纸很贵。

自2016年以来,纸制品的价格(包括新的纸浆和纸制品)以及废纸的回收已从过山车式折线图中出现。

  在传统的“纸”知识载体上,所有的思考都是新经济对社会起作用的一系列后果:电子商务和其他企业产生的包装需求,现代经济社会对环境的更高要求, 生产能力的落后和废纸进口的限制实际上都在推高纸价。

  废纸是一种可再生资源,现代的知识和信息载体(例如硬盘)也没有得到很好的处理。

一方面,数据非常脆弱。

12月26日下午发表本文时,微信公众号背景崩溃,公众号发布的信息暂时与读者断开连接。

  另一方面,数据有点贵。

数据的存储和使用具有明显的成本,实用的公司具有清除历史数据的想法。

  今年10月,旧的互联网公司Yahoo发布了一条新闻,标题总结了新闻内容,大概是这种绘画风格[1]:

  “雅虎宣布逐步关闭“雅虎集团”网站,在12月14日之后删除所有上载的内容”

  这个消息一出,就激怒了所有人。

Yahoo Group是Yahoo于2001年成立的在线讨论社区,是世界上最大的在线社区之一。

(其运营商雅虎于2017年被美国电信巨头Verizon收购。

  根据NPR报告[2],一些互联网历史研究人员表示强烈反对删除数据。

他们认为,雅虎集团保留了许多历史性讨论,包括9月11日事件。

是了解Internet早期历史的绝佳窗口。

  在NPR的讨论者中,有一个非营利组织的工作人员,致力于保存Yahoo组数据。

巧合的是,在著名的论坛Reddit上,一些用户已经开始开发各种工具来保存Yahoo组数据[3]。

但是Yahoo不允许这种情况发生-Yahoo宣布已禁止数百个试图归档Yahoo组数据的帐户。

是否要保存数据?

没门。

  该事件的最新消息是,雅虎已将个人数据的“保存期限”延长了一个多月,允许个人用户导出数据。

是否想从更高的维度检查这些自发形成和组建的网络遗物?

抱歉,这条路仍然封闭。

  数据仍然存在,谁来保护它们?

  在人类历史上,通常大小图书馆和博物馆都承担着“保存信息”的重要任务,并完成了知识和文明记录的转移。

在信息时代的过去几十年中,人类创造了前所未有的信息财富。

这些记录的载体是保存数据的硬盘(当然,还有其他数据载体)。

  但是人类真的在记录这个时代吗?

  英国广播公司(BBC)今年4月发表的评论提出了一个问题[4]:为何早期互联网历史档案中的内容如此之少?

  他们发现了更多的数据丢失案例:同样由电信巨头Verizon拥有的互联网门户“ AOL”在2013年关闭了其所有音乐网站,数百名撰稿人和数十名编辑工作了很多年,结果几乎消失了。

最后,作者悲观地认为,即使用户将照片发送到Facebook等平台,他们迟早也会丢失已被关闭的所有内容,例如Google+。

  历史学家尊重王国维的“双重审查方法”,并追求“纸上材料”和“地下材料”的相互参照。

在互联网时代,数据就是这种“纸上的材料”。

也有一些公司尊重数据,他们正在努力建立数据库。

  Internet Archives(Internet档案馆)成立于1996年,致力于归档各种网站的网页,但是即使建立了30多年,Internet Archives仍然错过了Internet诞生的五年时间,因此无法归档Internet。 整个互联网-更不用说随着移动互联网的诞生,今天的信息在封闭的系统中比可以公开访问和记录的网站页面更加分散。

  数据不可访问,存储是一个挑战。

一些公司正在尝试保留更多数据。

  上个月,代码托管平台Github宣布[5],它计划以胶片的形式存储包括Linux和Android在内的6,000多个受欢迎的开源项目的源代码,并将其存储在北极地区250米的地下仓库中。

预计这些数据可以保留数千年。

另一方面,为了满足对长期,低成本数据存储的需求,一些公司正在积极开发相应的技术。

例如,微软最近宣布了一种通过激光蚀刻在石英玻璃上存储数据的技术[6],声称可以将胶片原版雕刻在一块杯垫大小的玻璃上,这种玻璃可以存储数千年。

  100年后,谁属于历史数据?

  除了需要用感情来支付成本外,还有一个退缩问题:从长期的历史角度来看,谁将拥有这些数据?

  对于仍然存在的公司,复杂的用户协议通常会免除用户生成的数据,甚至将用户内容的所有权(版权等)归为所有权。

)到平台,并且不保证数据的保留期限。

对于已经消失的公司,以前的用户协议已成为历史数据一样的“旧纸堆”。

  在2015年的《纽约时报》的一则报道[7]调查了99个有英语服务条款或者隐私政策的网站,其中有85个网站称重,它们可能会在合并,兼并,破产,资产出售或其他发生交易时传输用户信息。

  我们可能已经对数据的生成和消失感到麻木了—关闭各种网络磁盘和博客平台是很常见的。

除了关闭之外,还有更多隐藏的数据。

例如,类似于Yahoo Group的产品百度邮政吧(Baidu Post Bar)在某些时刻还记录了大量有关民意的历史数据。

这些记录尚未追溯到至今。

  另一个问题是,即使可以追溯并保存了数千年的信息,具有明显个人特征和隐私的用户提供的这些内容是否可以进入公共领域并成为每个研究人员都可以引用的对象?

  在没有Internet的时代,传统出版业部分解决了这个问题。

我们仍然可以看到大量名人日记的出版。

一些名人,例如晚清的李次明和民国的胡适,甚至在去世前就开始发表日记。

这些内容也从公共出版物中受益,并受到保护免于传播。

  但是,“名人日记”始终不同于普通百姓朋友圈的日常抱怨。

今天,随着对“隐私”和“权利与利益”的日益重视,您在互联网上的讲话被记录了数年,数十年甚至数百年。

挖出“洛阳铲”作为历史资料研究。

您还需要批准,同意和签名吗?

  新一轮“文献灾难”的罪魁祸首

  在中国和国外的历史上有许多“文献灾难”。

  亚历山大图书馆,这可能是世界上最早的图书馆。

它收集了无数的古代经典,被大火烧毁了好几次。

在十字军东征期间,统治者出售了开罗和叙利亚图书馆的旧馆藏,以补全军队;在中国,古人称丢失的文件为“舒尔”,意思是“书中遇到的灾难。

从隋朝的“五恶”到明朝的“十恶”再到现代的“十五恶”,文件的销毁从未停止。

  综上所述,人类历史上文件的消失可以分为以下几类:

  一旦是一场政治灾难,前几代人的图书禁止活动也不得不出售图书,以因内忧外患而生存,并且从未停止过。

  第二个因素是战争因素。

每当发生内战或外战或朝代改变时,由战争引起的书籍都会不断燃烧和掠夺。

例如,在鸦片战争期间,中国最早的私人图书馆天一阁被抢劫。 清远名苑的图书馆文苑馆,因英法入侵而被摧毁。

  第三个原因是自然因素。

一些成熟的书店由于天灾和洪水等自然因素而被摧毁。

例如,在“十三元素之火”中摧毁了月牙堂的藏品; 俄罗斯科学院社会科学研究所信息研究所的大火导致内部图书馆被烧毁。

  但是Internet似乎更特别:在市场经济条件下,如果没有人愿意花钱保存这些文件,我们就不能怪它。

有些人拒绝以隐私为名透露资源,历史研究人员只能叹口气。

  时代在进步,互联网向我们展示了技术如何轻松地打破信息的不对称性,但最终,技术还暴露出其无法克服的缺陷:它无法为我们保存更多历史,甚至无法更轻松地消除历史。

  下一场“文献灾难”可能离我们不远了。

  相关报告:

  [1] 雅虎宣布逐渐关闭群组网站,12月14日后删除所有上传内容,澎湃新闻,

  [2] Internet Historians Mourn Loss Of Cultural Record As Yahoo Prepares To Delete Groups, NPR,

  [3] Verizon kills email accounts of archivists trying to save Yahoo Groups history, ZDNet,

  [4] why there's so little left of the early internet, BBC,

  [5] GitHub 要把全球开源代码埋在北极,保存 1000 年,爱范儿,

  [6] 微软将数据保存在玻璃中 可以安全地存储数千年,cnBeta,

  [7] When a Company Is Put Up for Sale, in Many Cases,Your Personal Data Is, Too, The New York Times,

TAG:

请在这里放置你的在线分享代码

相关阅读

发表评论

必填

选填

选填

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

摩登4
摩登4 摩登4

Powered By Z-BlogPHP,Theme By 刷机rom

XML地图 - HTML地图 - TXT地图
  • 阿华资讯网

    扫描关注微信