在九十年代中期,据估计,英语占互联网上所有内容的80%。现在,其他语言的在线表现得更好,但据认为,英语仍占所有网络内容的三分之一左右。

如今,中文,阿拉伯文,西班牙文和葡萄牙文都有很好的代表性。但并非所有世界语言都在互联网上占有重要地位,如果您没有其中一种主导网络语言的命令,它可以真正限制您在线可用的内容。

在世界上许多地方,如果您对当地企业(如理发店或餐馆)进行英语搜索,那么与使用少数语言(如波兰语或兰达语)进行搜索相比,您会发现更多结果。

如果你说阿拉伯语或爱沙尼亚语,你会发现与芬兰语或瑞典语发音者相比,你可以访问更少的维基百科文章。少数民族语言内容的范围和深度无法与在线的主流语言内容进行比较。正如“卫报”最近所说,“互联网只有你的语言一样大”。

您访问互联网的语言不仅会影响您所看到的内容,还会影响您在线查看的内容。维基百科是互联网活动的一个很好的尺度,因为它是一种超过4000万篇文章的资源,共有288种不同的语言,由互联网用户众包。

维基百科是一种基于网络的多语言免费百科全书,基于可公开编辑的内容模型。

不同的语言群体倾向于围绕特定主题产生更多内容,通常基于特定的文化兴趣,强迫观念和爱好者。有关日本流行文化的大量内容,但法语维基百科中关于此主题的页面少得多,同一主题页面可以说不同语言的不同内容。

在某些方面,这是完全有道理的。对于法语维基百科而言,涵盖法国用户不寻求的日本流行文化的细枝末节将是奇怪和不必要的。但74%的概念仅由网站上的一种语言涵盖。

如果您对这些概念感兴趣,那么您需要说相关语言。许多信息仅以少数语言提供,搜索引擎往往只向我们展示我们自己语言的可用内容。

互联网可能是人类的关键信息资源,但我们并不擅长分享我们与不同语言群体收集的信息。

信息不平等

网上信息不平等的一个令人不安的方面是信息及其增长可能是非常片面的。例如,描述世界上的特定地区。描述不同地理位置的维基百科文章往往集中在少数语言中。

少数语言描述世界,许多地区不是由他们自己定义,而是由其他语言群体定义。

世界整个南半球尤其如此,几乎完全由主流语言在线描述。例如,欧洲语言占据了许多非洲国家的大部分内容。

事实上,在线描述世界的多少方式影响了前殖民主义的统治模式。正如牛津互联网研究所的研究人员所说的那样,“富裕国家在很大程度上要定义自己,穷国主要由其他国家来定义。”这种模式令人不安并且绝对不公平。

搜索语言

搜索是大多数网络旅程的起点,我们用于网络搜索的语言似乎对我们可以访问的内容特别重要。Google是全球最受欢迎的搜索引擎,仅提供全球6000种左右的语言中的130种。它只承认一种非洲语言,而30种欧洲语言。因此,除非您使用多数语言,否则您无法使用互联网上最受欢迎的工具之一。

Google仅提供130种世界语言,在某些语言中提供的结果远远超过其他语言。

西岸的一项研究发现,与阿拉伯语中的同等搜索词相比,用英语进行的搜索得到的结果要多4或5倍,尽管这是一种关键的本地语言。

将搜索引擎归咎于此并不公平:谷歌只是设定规则,内容创作者提供内容。

与其他语言群体相比,阿拉伯语中维基百科页面的缺乏归因于世界上阿拉伯语区域的文盲和缺乏互联网接入。内容需要由语言发言者创建,以便对其进行索引。

互联网上语言优势的问题不仅重要,因为它们决定了在本地搜索中可以找到多少家餐馆; 这也是一个关于语言生存和少数民族语言群体文化自治的问题。

随着我们越来越多地依赖互联网作为信息的主要来源和访问重要服务的关键途径,说到网络语言的重要性也在增加。这样可以验证互联网上使用的语言,并降低在线无法很好表达的语言的能力。

2003年,语言学家大卫·莱克尔(David Crystal)认为,世界各地的英语使用已达到临界质量,并表示他相信这将是永久性的世界语言。不是每个人都同意这种观点,但很可能英语和少数“权力”语言如普通话可能在不久的将来继续占据主导地位。