More than 210 million news stories published on Sina.com, the news portal operated by the parent company of Weibo Sina Corp, together with 200 billion public posts on Weibo, will be archived under a non-profit project by the national library, according to a statement on Weibo’s official account on government services.
微博政务发布的消息称,新浪网发布的2.1亿多条新闻和微博上公开发布的2000亿条博文都将被国家图书馆存档并纳入该非盈利项目。
- Archive,读作 [ˈɑrkaɪv],可作为动词或名词使用,表示“存档;档案文件,档案馆”,比如,to archive documents(文件存档);an archive of historical manuscripts(历史手稿档案馆)。这里提到的互联网信息存档可以直接用web archiving或者online data archiving表示。
截至2018年12月,微博全站发布博文超过2000亿条、图片500亿张、视频4亿个、评论和赞总量近5000亿。新浪网和微博上新发布的内容,也将持续保存。
对此,不少网友表示:我的微博也进历史了!还有网友调侃,后代人看不懂我们的微博咋办......
据介绍,该项目旨在联合国内各信息保存机构,在全国范围内构建分级分布的中文网络信息资源采集与保存体系,保存互联网时代的国家记忆和数字遗产(to preserve national memory and digital heritage in the internet era)。
国家图书馆馆长饶权表示:
The project is established for the long-term development of national information security and the informatization of society.
启动互联网信息战略保存项目,旨在着眼于国家信息安全与社会信息化建设的长远发展。
根据相关规定,在信息数据保存方面,国家图书馆互联网信息战略保存基地将采取社会化保存模式,共建过程中信息数据仍由共建主体保存和管理(data collected from Weibo and Sina.com will be stored and managed on company servers),共建主体需确保其提供的信息数据完整、有效、安全(the company needs to make sure that data collected are complete, valid and secure),并拥有合法所有权(legal ownership)、知识产权(intellectual property right)或已获得相应授权(acquired authorization)。
国家图书馆将根据基地保存规范、数据遴选机制和服务需要提供使用需求,适时将部分基地数据纳入国家文献信息战略保存体系,并与共建主体联合开展数据分析,服务于政策决策、学术研究等非商业用途(jointly analyze the data for policymaking and academic purposes)。
互联网信息存档 国际上早有先例
事实上,很多国家都在开展互联网信息存档工作。
Archiving online data has become an increasingly popular means of recording the cultural and intellectual legacy of the modern digital world. Countries like the UK and the Netherlands have established their own institutes dedicated to digital preservation. In France and Germany, national libraries play the role of preserver.
互联网信息存档已经成为现代数字世界记录文化和知识遗产一种日益普遍的方式。英国和荷兰等国都已建立了自己专门的数字存储机构。法国和德国的国家图书馆都承担了数字存档的任务。
In 2003, an organization called the International Internet Preservation Consortium, or IIPC, was established to oversee the collection, preservation, and sharing of “knowledge from the global web.” Today, its members hail from 45 countries.
2003年,国际互联网保存联盟成立,旨在对“全世界互联网知识”的收集、存储和分享进行监督。目前,已有45个国家加入该组织。
The National Library of China joined the IIPC in 2007 and has been archiving over 20,000 government websites since then, as well as information about events such as the SARS epidemic in 2003, the Great Wenchuan Earthquake of 2008, and the Beijing Olympics the same year.
中国国家图书馆于2007年加入该组织,并已存档了2万个政府网站,以及2003年“非典”、2008年汶川大地震以及北京奥运会等事件的相关信息。
- 互联网信息存档 web archiving
- 隐私政策 privacy policy
- 信息安全 information security
- 国家战略 national strategy
- 数据收集 data collection
- 数字遗产 digital heritage