无声的声音——灭绝的语言消失在巴西博物馆的大火中
九月的国家地狱博物馆展示了物理遗迹很容易消失。这个著名博物馆中的2000万件文物不仅包括昆虫和化石,还包括土著人数百年来收集的衣服、工具和文件。对于人类学家、语言学家和音乐家来说,它还包含对话、仪式和歌曲的录音,这些在任何其他收藏中都不会重复:描绘在百年蜡烛上的采访;1912年在留声机上拍摄的土著音乐;20世纪60年代以来田野人类学家记录的电影、卷轴、磁带和录音带。虽然已经做了一些努力,但大多数语言收藏还没有数字化,现在已经永远丢失了。
毫不奇怪,作为对火灾的回应,《连线》杂志呼吁将世界档案数字化。但是数字档案馆的可持续性是什么?博物馆通常没有足够的资金来做所有他们应该或想做的事情,包括将所有藏品数字化。国家博物馆每年的维护预算是12.8万美元——从2014年开始,实际资金的收入甚至没有那么多。截至今年9月,拨款只有13,000美元。在这种情况下,数字文件的安全性如何?
世界上一半的语言多样性已经消失,因为我们现在已经从估计的峰值15-20,000种语言减少到大约7,000种语言,专家预测,剩下的一半将在本世纪末消亡。因此,保存的问题和我们一样离我们很近。我们如何捕捉和保留信息时代的文化和语言记录?
语言学家劳拉·麦克弗森(Laura McPherson)说:“尽管口头多样性肯定会继续下降,但通过记录和存档,这种非物质文化遗产的记录将永远保留。文件越全面——越超出语言使用的范围,包括文化活动、民间传说、土著分类、音乐等等——我们就可以用更丰富的记录和更好的画面来描述这些珍贵的人类天赋。”
如今,数字记录激增,尤其是智能手机上的录像机和社交媒体上的视频记录。YouTube会成为未来人类学家、语言学家、音乐家的重要基础吗?YouTube是谷歌搜索中使用最广泛的应用,比Gmail更受欢迎。该网站拥有13亿资产,每秒上传300小时的视频,拥有15亿活跃用户。不幸的是,网站不能让用户基于结构化内容进行过滤或搜索,而是依赖于主题标签。上传内容的用户可以选择识别视频的语言,但前提是用户需要时间,并且该语言恰好是列表中的190种语言之一。另外,语言元数据只适用于算法,不适用于研究人员。
目前,只有当视频的标题或描述恰好包含该词时,我们才能搜索到晦涩语言的名称。例如,对Nyanja的搜索显示了几个教程和一个口语用法的例子,语言学家或文化历史学家在将来会非常欣赏。然而,搜索带有主题标签的内容的用户可能找不到这个视频,因为他们可能会输入Chewa、Chichewa、Chinyanja或Cinyanja或Chinyanja——其他同名的常见名称。
允许用户正确标记内容,作为上传者或策展人,可以帮助识别语言学家、民族音乐学家和许多其他学科感兴趣的内容。然而,最终,像YouTube这样的商业服务可能不适合永久存储。谷歌和它的母亲公司Alphabet不一定会永久存档内容,尽管他们目前的意图是这样。一旦上传者的账户不再活跃,从长远来看,很少有人(如果有的话)会说语言的视频可能会被送往数字碎纸机。虽然它也容易丢失,但为学术记录保留的服务更安全。
濒危语言档案馆(ELAR)和拉丁美洲土著语言档案馆(AILLA)是可以在线访问的数字收藏、音频和视频的例子。美国国家科学基金会和伦敦大学濒危语言项目最近记录消失语言的努力需要对数字资产进行正式存档,迄今为止已记录了380种语言。但是即使是这些资金雄厚的机构您可能没有准备好可用文件的大小和归档它们的需要。
回到巴西,亚马逊有2000个部落。现在有500个,讲大约330种语言。随着智能手机和其他设备渗透到世界上最大的森林和流域的巨大树冠中,各种声音、歌曲和生活实践都会被捕捉并上传到社交媒体。如果连一个大政府都负担不起它的文化机构维护费用,那么科技行业本身能否发挥作用?我们每年都在失去我们的语言和文化,而且速度越来越快。当人们通过社交媒体和旅游、YouTube、脸书、网飞等分享文化信息时。公司可以获得收入。因此,在像Museu Nacional这样的收藏中失去重要的文化艺术品,在某种意义上代表了永久的收入损失,因为这些文物的图像、描述和讨论永远不会发生。与慈善家合作最符合行业利益, 非政府组织和其他私人和公共倡议,以帮助组织资源,以保护和分享世界知识这样一个著名的组织,如谷歌。

