当前位置:在线查询网 > 在线百科全书查询 > 语种

语种_在线百科全书查询


请输入要查询的词条内容:

语种


世界上有多少种语言。一说七千多种,一说五千多种,一说两千多种,无一定论。使用人口超过100万的语言只有140多种,其中汉语的使用人口最多,约占世界人口的五分之一。所以,汉语是联合国指定的六种工作语言之一,另外五种语言是英语、俄语、阿拉伯语、法语和西班牙语。



世界语种分类


Abkhaz 阿布哈兹语

Achinese 亚齐语

Acoli 阿乔利语

Adangme 阿当梅语

Afar

Afrihili(Aritifical language) 阿弗里希利语

Afrikaans 南非所用之荷兰语(阿非利卡语)

Afro Asiatic(Other) 其它亚非语系

Akan 阿坎语

Akkadian 阿卡德语

Albanian 阿尔巴尼亚语

Aleut 阿留申群岛之土语

Algonquian(Other) 其它阿尔贡语系

Altaic(Other) 其它阿尔泰语系

Amharic 阿比尼亚宫廷贵族的语言(阿姆哈拉语,一种南族语)

Apache languages 阿帕切语

Arabic 阿拉伯语

Aramaic 阿拉米语

Arapaho 阿拉帕霍语

Arawak 阿拉瓦克语

Armenian 亚美尼亚语

Artificial(Other) 其它人工语言

Assamese 阿萨姆语

Athapascan(Other) 其它阿撒巴斯卡语系

Australian languages

阿塞拜疆语

Balinese 巴里语

Baltic(Other) 波罗的海地区之语言

Baluchi 俾路支语

Bambara 班巴拉语

Bamileke languages 巴米累克语

Banda 班达语

Bantu(Other)

Basa 巴萨语

Bashkir 巴什基尔语

Basque 巴斯克语

Batak

Beja 别札语

Belarusian 白俄罗斯语

Bemba 别姆巴语

Bengali 孟加拉语

Berber(Other) 北非&回教土族之语言

Bhojpuri 博杰普尔语

Bihari

Bikol

Bini

Bislama

Braj 布拉杰语

Breton 布尔吞语

Buginese 布吉语

Bulgarian 保加利亚语

Buriat

Burmese 缅甸语

Caddo 卡多语

Carib 巴勒比语

Catalan 加泰隆语

Caucasian(Other) 其它高加索语系

Cebuano 宿务语

Celtic(Other) 其它凯尔特语系

Central American Indian(Other) 其它中美印第安语系

Chagatai 查加语

Chamic languages

Chamorro 查莫罗语

Chechen 车臣语

Cherokee 彻罗基语

Cheyenne 夏延语(切延内语)

Chibcha 契布卡语

Chinese 汉语

Chinook Jargon 契努克语

Chipewyan

Choctaw 乔克托语

Czech 捷克语

Dakota 达科他语

Danish 丹麦语

Dayak

Delaware 特拉瓦印第安人语

Dinka 丁卡语

Divehi

埃塞俄比亚语

Ewe 幽语

Ewondo

Fang 芳格语

Fanti 芳蒂语

Faroese 法罗语

Fijian 斐济语

Finnish 芬兰语

Finno-Ugrian(Other) 芬匈语(其它)

German,MiddleHigh(ca.3050-3500) 中古高地德语

German,OldHigh(ca.750-3050) 古代高地德语

Germanic(Other) 其它德语语系

Gilbertese 吉尔伯特斯语

Gondi 岗德语

Gorontalo

Gothic 哥达语

Grebo 格列博语

Greek,Ancient(to 3453) 古希腊语

Greek,Modern(3453-) 近代希腊语

Guarani 瓜拉尼语

Gujarati 古吉拉特语

Gwich’in

Haida 海达语

Hausa 豪萨语

Hawaiian 夏威夷语

Hebrew 希伯来语

Herero 赫雷罗语

Hiligaynon 希利盖农语

Himachali 赫马查利语

Hindi 北印度语(印地语)

Hiri Motu

Hittite

Hmong

Hnpa (胡帕语) 印度语(其它)

Indo-European(Other) 其它印欧语系

Indonesian 印尼语

Interligua(International Auxiliary Language Association) 国际辅助语

Interlingue

Inuktitut

Inupiaq

Iranian(Other) 其它伊朗语系

Irish 爱尔兰语

Irish(Old) to 3300

Japanese 日语

Javanese 爪哇语

Judeo-Arabic 犹太&阿拉伯语系

Judeo-Persian 犹太&波斯语系

Kabyle 卡比尔语

Kachin 卡琴语

Kalatdlisut

Kamba 卡姆巴语

Kannada 坎纳达语

Kinyarwanda 卢旺达语

Kongo 刚果语

Konkani 刚卡尼语

Korean 朝语

Kpelle 克佩列语

Kru 克鲁语

Kuanyama

Kumyk

Kurdish 库尔德语

Kurukh 库鲁克语

Kusaie

Kutenai 库特内语

Kyrgyz 柯尔克孜语

Ladino 拉迪诺语

Lahndi 拉亨达语

Lamba 兰巴语

Lao 老挝语

Latin 拉丁语

Latvian 拉脱维亚语

Letzeburgesch

Lezgian

Makasar 望加锡语

Malagasy 马拉加斯语

Malay 马来语

Malayalam 德威拉土语之一(马拉维拉姆语)

Maltese 马耳他语

Mandar

Mandingo 曼丁哥语

Manipuri 曼尼普里

Manobolanguages 马诺博污

Manx 人岛语

Maori 毛利语

Mapuche

Marathi 马拉蒂语

Mari

Marshall 马歇尔语

Marwari 马尔尼里语

Masai 萨伊语

Mayan Languages 玛雅语系

Nahuatl

Nauru

Northern Sotho 北索托语

Norwegian 挪威语

Nubian languages 努比亚语

Nyamwezi 尼亚姆韦齐语

Nyanja 尼昂加语

Nyankole

Nyoro 尼约罗语族

Nzima

Occitan(post-3500)

Ojibwa 北美印第安人&大种族之语(奥季布瓦语)

Old Norse

Old Persian(ca.600-400B.C.)

Oriya 奥里亚语

Papuan-Australian(Other) 其它巴布亚�澳洲语系

Persian 波斯语

Philippine(Other) 其它菲律宾语系

Phoenician

Polish 波兰语

Ponape 波纳佩语

Quechua 盖丘亚语

Raeto-Romance 罗曼斯方言

Rajasthani 拉贾斯坦语

Rapanui

Rarotongan 拉罗汤加语

Santali

Sardinian

Sasak

Scots 苏格兰语

Selkup 塞尔库普语

Semitic(Other) 其它闪族语系

Serbo-Croatian(Cyrillic) 塞尔维亚�克罗地亚语(基里尔字母之一)

Serbo-Croatian(Roman) 塞尔维亚�克罗地亚语(罗马字母)

Serer 谢列尔语 srr

Shan 掸语

Shona 绍纳语

Sorbian languages 索布诸语言(西斯拉夫诸语言和方言)

Sotho 索托语

South American Indian(Other)其它南美印第安语系

Spanish 西班牙语

Tatar 塔塔尔语

Telugu 泰卢固语

Temne 提姆语

Terena 泰雷诺语

Tetum

Thai 泰语

Tibetan 藏语

Tigre 提格雷语

Turkish 土耳其语

Turkish,Ottoman 奥托曼土耳其语

Turkmen 土库曼语

Ukrainian 乌克兰语

Umbundu 莱都(姆崩杜语)

Undetermined 未定语种

Urdu 印度斯坦回教徒所通用之一种语言(乌尔都语)

Uzbek 乌兹别克语

Vai 瓦伊语

Venda 文达语

Vietnamese 越南语

Volapuk

Votic 沃提克语

Wakashan languages

Walamo 瓦拉莫语

Warav

Washo 瓦绍语

Welsh 威尔斯语

Wolof 沃洛夫语

Xhosa 科萨语

Yakut

Yao 瑶族语

Yap 雅浦语

Yiddish 依地语

Yoruba 约鲁巴语

Yupik languages

Zande

Zapotec 萨波蒂克语

Zenaga 泽纳加语

Zhuang

Zulu 祖鲁语

Zuni 祖尼语

世界语言联系


一种语言

总的来说,语言学能够指出两种语言有多么相似,但是认定是否同种语言的问题,更多地是依赖于国家、民族、政治、历史等多种因素。

比如克罗地亚语(Croatian)和塞尔维亚语(Serbian)其实完全是一种语言(统称塞尔维亚-克罗地亚语,Serbo-Croatian),只是前者采用了罗马字母,而后者采用的是西里尔字母(Cyrillic,就是俄语所用的字母),这与两个民族的历史文化有关。与此类似,捷克语和斯洛伐克语之间可以毫不费力地听懂对方,就象两种方言一样,但是人们传统上还是把它们看作两种不同的语言。

一套书写符号

一种语言可以由两种书写符号(字母)表示,同样地两种语言也可以共用一套书写符号。

如藏语,就是由于公元七世纪一个西藏喇嘛到克什米尔进修后引入了梵语字母(Sanskrit,即印地语的前身)这使它们看上去有些相似,然而这两种语言之间毫无联系:藏语属于汉藏语系而印地语属于印欧语系。

我们熟悉的汉语、日语和朝鲜语,由于后两者在中世纪时大量借用了汉字,人们一直怀疑它们之间有某种联系,然而至今为止尚未发现任何令人信服的证据证明它们之间有联系,实际上日语和朝鲜语与当今世界上任何已知的语言,无论是“活着的”还是“死了的”语言,都没有发现任何肯定的联系。

在研究了世界上一些主要语言以后,语言学家也象生物学家那样,把世界上的语言按相似程度分为语系、语族、语支和语种。

世界上主要的大语系


语系 代表语言 占世界语言百分比

印-欧 英语、法语、俄语、印地语、波斯语 48%

汉-藏 汉语、藏语、泰语、缅甸语 24%

尼日尔-刚果 斯瓦希里语 6%

亚-非 阿拉伯语、希伯来语 5%

马来亚-波利尼西亚 印度尼西亚语、马来西亚语 5%

德拉维达 泰米尔语 3%

阿尔泰 土耳其语、蒙古语、哈萨克语 2%

除了上面这些“可以归类的”语言以外,还有几种所谓的“独立语言”:

日语(2%),朝鲜语(1%)和越南语(1%)。这些独立语言与所有现存的语言没有明显的联系,这当然也和它们研究得不够有一定关系。比如日语与朝鲜语可能有一些关系。具有讽刺意味的是,尽管它们都不同程度地采用了汉字作为书写语言的一部分,它们与汉语都没有联系。

世界语言的分类


有些语言则只为几千乃至几百人使用,如美洲的土著印第安语,中国的鄂伦春语、赫哲语。

分类标准

一是按结构分类,即以语言结构的特点来进行分类。

⒈:词汇附着型语言。这种语言的词用在句子里时,词形不表示语法关系的形式,必须用其他词汇附着句子里,才能表达语法关系。如汉语中的时间,必须加 现在,昨天,明天 等词汇才能表达。

⒉ 字母附着型语言。这种语言的主要特点是靠词尾,前后缀(用一定的字母组合)等来产生语法形式,表示各种语言关系。例如英语,俄语中词的性,数,格,位的变化都是靠词尾和前后缀来表现的。印欧语系的语种,大多属于这一类型。

3. 混合型:以上两者兼有之。如日语中的主语,状语,宾语分别用字母 “が,に,を” 表示,而现在时,过去时则用词汇”ぁります, ぁりますした” 表示。

二是谱系分类。谱系分类是根据语言的历史渊源,地理位置,亲属关系,把世界上的语言分为若干语系,语系以内再分为若干语族,语族以下再分为若干语支。

分类方法

1.中国北京大学分类法

中国北京大学中文系教授徐通锵,胡吉成将世界语言分类为13个语系,45个语族。这13个语系是:汉藏语系、印欧语系、高加索语系,乌拉尔语系、阿尔泰语系、达罗毗荼语系、南亚语系、南岛语系、闪--含语系、尼日尔—科尔多凡语系,尼罗---撒哈拉语系,科依桑语系,北美印第安语系。

2. 英国Simon大学遗传学分类法

(1)欧亚语系,包括汉藏语系、印欧语系。

(2).太平洋和非洲语系,包括.除欧亚语系,南北美洲以外其他各国的语言。

(3).北美语系:北美洲土著印第安语言。

(4).南美语系:南美洲土著印第安语言。

3. 澳大利亚国家标准语言分类法

北欧语系,5个语族,16种语支

南欧语系,5个语族,16种语支

东欧语系,7个语族,25种语支

西南亚和北非语系,3个语族,21种语支

南亚语系,5个语族,16种语支

东南亚语系, 3个语族,23种语

东亚语系,4个语族,15种语支

澳洲土语语系,8个语族,56种语支

其他语系,7个语族,41种语支

4. 美国麻萨诸赛洲理工学院(麻理工学院)分类(完全按地区)

非洲语系:北非语族,南非语族,东非语族,西非语族

亚洲语系: 北亚语族,南亚语族,东亚语族,西亚语族,中亚语族,东南亚语族

澳太语系: 澳大利亚及太平洋诸岛国。

北美语系:北美洲各国语言,包括土著印第安语言。

南美语系:南美洲各国语言,包括土著印第安语言。

欧洲语系:日耳曼语族,包括英语、德语、荷兰语、斯堪的纳维亚半岛各主要语言。拉丁语族,包括法语、意大利语、西班牙语、葡萄牙语和罗马尼亚语等。斯拉夫语族有俄语、保加利亚语、波兰语等。波罗的海语族包括拉脱维亚语和立陶宛语等。

上述分类方法都有一个共同的缺点,就是都没有将人造国际语列入分类中。在当今世界,人造国际语已经如此普及的今天,这实在是一憾事。

综观上述,比较合理的分类方法应该是:

一. 印欧语系

印欧语系 是最大的语系,下分日耳曼、拉丁、斯拉夫、波罗的海,印度、伊朗、等语族。世界上除了亚洲(不含南亚各国)外,各大洲大部分国家都采用印欧语系的语言作为母语或官方语言。使用人数大约40亿,占世界人口的70%。

印欧语系可分为:

拉丁语族:包括法语、意大利语、西班牙语、葡萄牙语和罗马尼亚语等。

日耳曼语族:包括英语、德语、荷兰语、斯堪的纳维亚半岛各主要语言。

斯拉夫语族:有俄语、保加利亚语、波兰语,塞尔维亚语等。

波罗的海语族包括拉脱维亚语和立陶宛语等。

印度语族包括梵语、印地语、巴利语,达罗毗荼语支(印度南部的语言都属于这一语支)等。

伊朗语族包括波斯语、阿富汗语等。

高加索语族 这一语族的语言分布在高加索一带,主要的语言有格鲁吉亚语、车臣语等。

乌拉尔语族 下分芬兰语支和乌戈尔语支。前者包括芬兰语、爱沙尼亚语等,后者包括匈牙利语、曼西语等。

二:. 汉藏语系 是仅次于印欧语系的第二大语种。使用人数大约15亿。下分汉语和藏缅、壮侗、苗瑶等语族,包括汉语、藏语、缅甸语、克伦语、壮语、苗语、瑶语等。还包括阿尔泰各语族,如西阿尔泰语族、东阿尔泰语族。前者包括突阙诸语言以及前苏联境内的楚瓦什语,后者包括蒙古语以及前苏联境内的埃文基语。

三: 非太语系:包括除欧亚语系、南北美洲以外其他各国的语言。非洲及太平洋诸国采用这种语言。

尼罗—撒哈拉语族:主要是非洲北部及西部各国语言,

尼日尔—刚果语族:主要是非洲中部各国语言,如尼日尔语,刚果语,斯瓦西里语等。

科依桑语族:主要是非洲南部及东部各国语言,主要有霍屯督语(纳米比亚),布须曼语(南非等),散达维语(坦桑尼亚等)。

闪-含语族(闪米特-含米特语族)。主要应用于中东地区。下分闪语族和含语族。前者包括希伯来语、阿拉伯语等,后者包括古埃及语、豪萨语等。

南岛语族:主要有东南亚及太平洋各岛国语言,如印度尼西亚语,马来语,爪哇语,斐济语,毛利语等。

南北美洲土著印第安语言。如玛雅语,爱斯基摩—阿留申语等。

澳大利亚洲土语语言。

人造语言


当然谈到“世界的语言”,还应当包括几种“人造语言”,如世界语——Esperanto。

尽管还没有人以它们作母语。

印欧语系是世界上最大的语系,覆盖了几乎所有的欧洲、美洲,和亚洲、澳洲的很大一部分。它包括两种伟大的古典语言:古希腊语和拉丁语;包括象英语德语,菏兰语(在比利时也叫佛兰芒语,Flemish)和瑞典语一类的日耳曼语族;包括象法语,意大利语和西班牙语一类的罗曼语族;包括象俄语,波兰语,捷克语和塞尔维亚-克罗地亚语一类的斯拉夫语族;包括象威尔士语和盖尔语(Gaelic,在苏格兰和爱尔兰)这样的塞尔特(Celtic)语族;包括巴尔的(Baltic)诸语言;包括伊朗的国语波斯语;包括诸如印地语、孟加拉语一类的印地语言;等等。

原始的印欧人生活在什么年代?是从何处“发迹”的?

现在找不到原始印欧人留下的任何“书面材料”,因为人类使用语言的历史远比使用文字的历史久远。所以,最好的办法就是分析他们的语言。我们可以假定如果一个词在大多数印欧语言中都很相似,那就是一个他们已有的概念;反之就可以认为那是一个后来才知道的概念:这就是语言学重现“化石语言”所用的方法。

通过重建古代印欧人的语言,我们大约可以了解到:原始的印欧人生活在寒冷的北方森林中一个不靠近水的地方,他们饲养的家畜有马,牛,羊和狗,他们知道的野生动物有狼和熊,他们知道的金属可能只有铜。许多人认为马和战车使他们在征战中能取得很大优势从而扩展到后来的辽阔地域。(玩过civilization的朋友们知道horse和chariot在古代战争中的作用:-)

一般认为原始印欧文明起自于公元前三千年,也就是五千年以前的东欧某地,大约在公元前二千五百年它分裂了,人们离开故乡分好几路向四面八方迁移。其中一路到了希腊,另一路到了意大利(这两路分别是古希腊和古罗马文化的起源)。另一路穿过中欧一直到达不列颠诸岛(他们是苏格兰人,爱尔兰人和威尔士人的祖先)。还有一路北上到了俄国,同时又有一路跨过伊朗,阿富汗最终到了印度。他们每到一处,就征服或同化当地的土著,把自己的语言传播到那里。应该说他们是一个出色的民族。

许多语言可能是从一个祖先那儿演变出来的,这想法最早是在1786年提出来的,尽管早在十六世纪有人就注意到了梵语和意大利语之间的相似性。到了1818年,有五十多种语言归到了印欧语系中,然后在1854年,人们把独特的阿尔巴尼亚语也归了进来,1875年又加上了亚美尼亚语。如今在欧洲,只有芬兰语、匈牙利语、土耳其语、巴斯克语(在西班牙和法国交界处)

和前苏联境内的几种语言不属于印欧语系。

在亚洲,印欧语言出现在伊朗、阿富汗、巴基斯坦、印度和孟加拉等国家。值得注意的是,虽然在印度,印地语(Hindi)是最大的语言,但是操非印地语的当地原住民势力也很强大。印度有一百五十多种语言,但讲任何一种语言的人都不超过百分之三十。所以它在1947年独立时不得不同时采用印地语和英语作为官方语言——一半以上的印度人根本就不懂印地语嘛。在大约公元前一千年印欧人入侵以前,当地原住民所操的德拉维达语系(如泰米尔语)

和蒙达语系,如今在印度中、南部人口中仍占很大的比例。在巴基斯坦和孟加拉国大部分人讲印欧语言。他们都能在一定程度上听懂印地语,但互相之间却很难听懂。一个学法律的孟加拉朋友告诉我,他认为二十年前巴、孟分裂成两国,除了地理上的隔阂外,语言上的隔阂也是一个重要因素。

印欧语言之间究竟有多象?印欧语言与非印欧语言的差别有多大?看看几个“基本词汇”之间的比较:

英语month mother new nose three威尔士语mis mam newydd nos tri德语Monat Mutter neu Nase drei瑞典语ma^nad moder ny na"sa tre法语mois me`re nouveau nez trois西班牙语mes madre nuevo nariz tres意大利语mese madre nuovo notte tre俄语mesyats mat'' novy nos tri希腊语men meter neos rhis treis_ _波斯语mah madar nau bini se_ _梵语mas matar nava nas trayas芬兰语kuukausi a"iti uusi nena" kolme匈牙利语ho''nap anya u''j orr ha''rom土耳其语ay anne yeni burun u"c,

英语发展


作为当今世界事实上的国际社交语言,它取得的成功是史无前例的。从使用它的人口来说,以英语为母语的人数仅次于汉语而居世界第二位,大约有四亿多人。然而以英语作为第二语言、或者在一定程度上使用英语的人数,要远比这多得多,可以说分布在世界的各个角落、各个民族,在这一点上汉语是望尘莫及的。它是怎样发展起来的?

英伦三岛

的第一批印欧居民是塞尔特人。原先岛上可能还有更早的居民,但是人烟稀少,所以没有留下多少遗迹。前文提到,塞尔特人是古印欧人的一支,大约在四千五百年前离开他们在东欧的故乡向西迁移,在公元前一千年时(相当于我国商朝末年、西周初年),他们成了德国南部、阿尔卑斯山北麓的一个强大民族。在公元前五百年左右(相当于我国春秋时期),他们开始向西迁移,后来到了英伦诸岛。这就是印欧人的第一次“入侵”。

印欧人

的第二次入侵是在公元五世纪中叶,当时生活在现在的德国和丹麦交界处有两个部落,一个是石勒苏益格(Schleswig)的盎格鲁(Angles),另一个是霍尔施坦因(Holstein)的萨克森(Saxon)。石勒苏益格/霍尔施坦因现在是德国最北面的两个州,是第一次世界大战时德国从丹麦那里“取得”的。这两个部落从那里跨过北海,占据了英格兰,原来的塞尔特人很快地后退到威尔士、爱尔兰和苏格兰高地。English一词就出自Angles,原意为“角落”,意即他们来自欧洲大陆的一角。在古英语中Angle写作Engle,他们的语言叫做Englisc(在古英语中“sc”读如“sh”,如“sceap”——“sheep”)。顺便说一句,“塞尔特”(Celt)中的c可以读如s或k,所以也叫“凯尔特”,美国人中有许多来自苏格兰和爱尔兰,所谓的“美国腔”可能是凯尔特口音。波士顿不是有个著名的球队叫“凯尔特人队”嘛。

诺曼人

古英语一直发展到公元1066年法国的诺曼人入侵。在此以前,由于受北欧人和罗马人的影响,许多斯堪地那维亚词汇和拉丁词汇溶了进来。前者如egg,cake,skin,leg,window,husband,sky,fellow,skill,anger,flat,ugly,odd,get,give,take,raise,call,die,they,their,them;后者如street,kitchen,kettle,cup,cheese,wine。塞尔特语的遗迹大多留在地名中,如Thames,Kent,Dover。

诺曼人的入侵为英语带来了大量的法语词汇,这使得现代英语中存现大量的同义/近义词:shut/close,answer/reply,smell/odor,yearly/annual,ask/demand,room/chamber,wish/desire,might/power(英语词/法语词)。有一个有趣的现象是产肉的动物多是英语词,如ox,cow,calf,sheep,swine,deer,而它们的肉则是法语词,如beef,veal,mutton,pork,bacon,venison。大概持法语的多为贵族统治者,只注意他们餐桌上的肉,并不在意牲畜们叫什么。

另外在已有的英语/斯堪地那维亚语同义词基础上,如英语的wrath和斯堪地那维亚语的anger之外,法语又加了个ire。连我们汉语也贡献了几个词:kowtow(叩头),typhoon(台风),sampan(舢板),kaolin(高岭土),tea(闽方言),shanghai(不是地名:-))。

这些外来语使英语成为一个表达力丰富的语言。尽管溶入了如此众多的“外来语”,古英语仍然构成了它的核心——不到五千的古英语单词一直保持到了今天。在此期间英语逐渐向高层发展,1399年继承王位的亨利四世是第一个以英语为母语的英国国王。在十四世纪快要结束的时候,乔叟(Chaucer)完成了『坎特伯雷的传说』(Canterbury Tales),以伦敦方言为代表的现代英语终于开始出现:一个来自当年“角落”的语言。

汉-藏语系


概述

汉藏语系里有一个“大家伙”,不用猜就知道。它占汉藏语系总人口的85%以上。不过,对于非印欧语言的语言学研究都不如印欧语系那样深入,它的起源、发展、演变等都有许多问题有待解决。

汉藏语系分四个语族:汉语自成一家;藏-缅语族,包括藏语和缅甸语这两大语种,以及彝、傈僳、纳西、拉祜、景颇、京等上百个小语种;泰-老语族,包括泰语和老挝语这两个国语,以及壮、布依、侗等几个小语种(壮语不应算小语种!有一千多万人讲壮语,比一些小的语系还大,他们不是还有自己的自治区嘛);还有一个苗-瑶语族,由苗语和瑶语组成。另外,不少人认为越南语与汉语有远亲关系,事实上越南语有一半的词来源于汉语,但是它们的关系仍有待进一步研究。

分布

讲汉藏语言的人除了在中国以外,还分布在缅甸、印度、尼泊尔、泰国、老挝等国,以及在东南亚和世界各地的华人中。总之,持汉藏语言的各民族中,汉族生活在最北面。

汉语是论人口世界上最大的语言,有十多亿人以汉语为母语:这包括在台湾的二千万、马来西亚的五百万、泰国的五百万、香港的五百万、新加坡的二百万、印度尼西亚的一百万、越南的一百万等。汉语是联合国1945年成立时的五种工作语言之一(1974年又加上了阿拉伯语)。

主要方言

汉语有七种主要的方言:北方方言约占总人口的四分之三,所覆盖的地域包括中国的东北、华北、西北、山东、河南、湖北和安徽、江苏的长江以北部分、四川、云南和贵州的汉族人聚居区,在另外还有一些北方方言的“孤岛”在福建、广西和海南;吴方言,通行于江苏的长江以南部分、浙江和上海市,人口有七千万,是第二大方言;粤方言,主要流行于广东、广西和海外华人中间,约有六千万人;闽方言,通行于福建、台湾和东南亚诸国,约有六千万人,其中情形十分复杂,到了互不通行的程度,可能是汉人在秦汉时代南侵时与当地的语言交互的结果;湘方言通行于湖南;赣方言通行于江西,这两种方言的特征不太突出,受周围方言的影响较大;还有客家话,主要分布于广东、广西、福建和台湾。这些“方言”之间差别常常是很大——比如北京人听广州人讲话,决不比英国人听法国人讲话轻松,台湾人去听陕西话,也会听得一头雾水。是什么理由语言学仍把这些方言统统归为一种语言?除了长期以来的统一民族、统一文化和统一国家这些因素以外,还有一个重要的原因是文字——汉字。

历史发展

从商朝的甲古文开始,汉字有三千多年的连续历史,三千多年来汉字的字形、字义的变化都是连续的。与大多数其它语言不同的是,汉字的发展经历了一条象形—表意—形声的途径。这条道路产生了两个主要效应:第一,随着文明的不断发展,语言所要表达的概念不断增加,使得汉字拥有了一个数量庞大的字符集(虽然现代汉语已经不用增加字符来表达新的概念,而是创造新词,这在一定程度上减少了使用的字数)。汉字的庞大的字符集使它显得非常复杂:难学、难记、难用;第二,历史上的汉字作为表意文字(ideograph),文字与语音没有直接关系,无论用哪种语言或方言去读,意义没有变化。这是几千年来各种口语分化交熔变迁,而汉字一直作为一种统一的文字被所有人认同的原因。这一优势甚至体现在当它被别的语言借用的时候:哪怕不懂日语的人也能读懂一半意思吧。汉字使操不同口语的人互相交流成为可能,而隔膜是统一的主要障碍。

后来,随着汉字的演变,汉字已不再是纯粹的表意文字,许慎『说文解字』中的9353字里面,“形声字”占了80%以上,“会意字”不到20%,而甲骨文中形声字仅占20%多。特别是近年来多音词的比例急剧上升,汉字已向表音文字方向发展。(关于“形声字”、“会意字”,后面还要提到。)

现代汉语的文字仍有几万字之多,但是使用频率极不平衡。据北京语言学院1985年的统计结果,最常出现的前十个字及其出现频率为:

的 4.16% (你每说二十五个字就要说一个!)

一 1.84%了 1.71%是 1.52%不 1.37%我 1.28%在 1.08%有 0.98%人 0.97%这 0.93%

累计 15.85%

前100字的累计字频已达47.34%,500字到了79.76%,2000字覆盖了98.07%,如果你认识4000字(就象我一样),你读一万个字只有四个不认得(当然读我写的东西再多你也不会有不认得的字,因为我认的字和你一样多)。

语言学院还统计了词:共计出31159个不同的词,其中单音节词(一个字的)占12.2%,双音节词73.6%,三音节词7.6%,四音节词6.4%五以上的占0.2%,平均词长2.09。前100词的累计频率为41.7%,2000词为82.2%,9000词为95.85%。不同汉字的构词能力(与别的字组成新词的能力)也不一样,最多的是“子”字,构词668个。

中国境内的语言

在中国境内的语言是多种多样的,

北方的语言多属阿尔泰语系,有属阿尔泰语系突厥语族的维吾尔语、哈萨克语、乌孜别克语、柯尔克孜语、塔塔尔语(鞑靼语)、撒拉语(青海境内的撒拉族);阿尔泰语系通古斯语族的满语、锡伯语、鄂温克语和鄂伦春语;阿尔泰语系蒙古语族的蒙古语、达斡尔语、东乡语和土语(青海土族的语言);还有印欧语系的俄语和伊朗语族的塔吉克语等等。南方的语言多属汉藏语系,除了上文提到的汉-藏语系诸语言外,尚有属南亚语系孟-高棉语族的佤语和德昂语、布朗语,以及属南亚语系印度尼西亚语族的高山语(台湾高山族)。

中国境内文字的种类同样多种多样。除了使用(或部分使用)汉字的语言以外,还有许多使用罗马拼音文字,如壮文。这其中又有不少是原本没有文字的,“新中国成立后,当地人民政府依照本民族人民的意愿,为他们创造了以拼音字母为基础的文字。”还有使用梵语字母的如藏文,使用阿拉伯语字母的如维吾尔文,使用“十三世纪维吾尔文”的蒙文、满文、锡伯文(维吾尔人后来丢了自己的文字用了阿拉伯文,呜乎),有些民族使用自己的表意文字,如彝文。还有用象形文字的纳西文(可能现在已经不用了)。至今没有自己文字的民族都借用了就近的大语种文字。

还有就是谚语,但都是用汉字,例如 闽南语,粤语等,还有就是闽南语,粤语等,每个地方都有不同的细微的发音。

朝鲜文

朝鲜族用的朝鲜文是唯一东方自己发明的“纯粹”拼音字母。说它是“纯粹”,因为它有表达元音和辅音的完整音素集合。音素(phone)是人能分辨的最小语音单位。与此相对的是日语的假名,虽然也是拼音文字,但是每个假名表达的是整个音节(syllable)而不是音素。朝鲜语在语法结构上最象日语,但是它们的词汇并不相似,所以它们的关系仍有待于进一步研究。另一方面,朝鲜语又从汉语借走好多词汇,但在语法结构上又非常不一样。有人认为朝鲜最早的居民是一万年以前从北方移入的通古斯人一部。朝鲜文字母发明于十五世纪中叶(相当我国明朝前期),共有二十五个字母——字母在哪儿?

你要是仔细看就可以看出,虽然它们看上去象一个个的“方块字”,但每个“方块字”其实是由一些更小的“小零件”组成,这每个“小零件”就是一个字母,它们的种类是有限的,对吗?他们的字母不象其它拼音文字那样排成一条线,而是上下左右错落有致地拼在一个方块内,非常别致。象“眼泪”这个词,它们读作nunmul(nun意为“眼睛”,mul意为“水”),写成从左到右两个“方块字”:

南亚语系

在亚洲的东南部,不是还有菲律宾、马来西亚、印度尼西亚等国吗,他们的语言是什么样子的?

他们的语言属于马来亚-波利尼西亚语系,又有人把这语系与孟-高棉语系(主要是柬埔寨的高棉语)和印度南部的蒙达语系合称“南亚语系”。这一系语言横跨了半个地球:东起夏威夷诸岛,西达非洲东南的大岛“马达加斯加”(Madagascar),包括了几乎所有的印度洋和太平洋岛屿(包括密克罗尼西亚、美拉尼西亚和波利尼西亚诸岛,但不包括巴布亚新几内亚和澳洲)。

它包括四种国语:马来西亚语、印度尼西亚语、他加禄语(菲律宾语)和马拉加斯语(马达加斯加),总人数有二亿多。关于他们的祖先,有人类学家认为是生活在中国大陆东南沿海地区,在公元前二千纪至一千纪之间汉族人开始南侵的同时,他们的航海技术也发展到了一定的水平,开始向海外移居(不知是不是受到了汉族的压力),台湾高山人可能就是他们的后裔。在其后的二千年间,他们遍布了如此众多的海岛,占据了如此辽阔的海域,这应当算一大奇迹——尽管他们自己可能倒没意识到。有人说,是航海、贸易与殖民造就了今日的资本主义,那他们的航海要比西方的“厉害”得多,也早得多,为什么一点儿也没有“发达”的意思?

澳大利亚和巴布亚新几内亚的语言和上面讲到的马来亚-波利尼西亚语言又有很大不同。

所谓澳大利亚语言,当然是指生活在那儿的土著居民,白种人们自然是讲英语。

今天在澳大利亚的土著人只剩下数万人,可是他们仍在讲数百种语言!对这些语言的研究进行得很不充分,连它们是否属于一个单一的语系也没搞清楚。由于澳大利亚自人类出现时就已经成为一块独立的陆地,所以,所谓的“当地土著”,肯定也是什么时候从其它地方迁来的。澳大利亚本地的哺乳动物都是非常原始的有袋类,离进化到人类还差十万八千里。现代许多人类学家认为当地人是新石器时代某个时候从马来亚——印度尼西亚渡海而来,可这还没有找到足够的语言学方面的证据支持(其它方面可能有证据,我不清楚)。今天,许多当地的语言都面临绝灭,可怜它们作为历史的遗迹只在英语中留下了象kangaroo,koala等少数几个词汇。

在巴布亚新几内亚的情况与此相似:三百多万人说着五、六百种语言,从这不难想到,有些语言肯定只有很少的人使用,有的可能只有一个村子,甚至一个家庭。邻村的人可能互相都听不懂,许多人尚生活在石器时代。所有这些给独立后的政府提出了很大的难题:不可能找到一种(甚至几种)当地语言作为官方语言来发号施令。所幸的是,在几百年的殖民统治以后,当地土著居民发明了一种叫“洋泾浜英语”的交流工具,它取得了官方语言的地位。

皮钦英语

“洋泾浜”是俗称,正式的称呼是皮钦英语(Pidgin English)

。“洋泾浜”一词来自上海原来的一条河,就是现在的延安路。当时在上海英租界也有自己的“洋泾浜英语”,“假洋鬼子”们常说“let me seesee”(让我看看)或“no can do”(不能做)这样不伦不类的话。所谓皮钦语言就是指一种外来语言被当地人大大地简化了语法和词汇以后用作交流工具,这种现象在不少殖民地都有。巴布亚新几内亚的皮钦英语约有1500个词和非常简单的语法,这使它很容易学会。而且许多词汇还是由一些更基本的词汇组成的复合词,如“house cook”意为“厨房”,“house sick”意为“医院”,“house paper”意为“办公室”等等。另外“belong”变成了一个常用词,仅表示“of”的意思,如“glass belong look-look”意为“镜子”,“smoke belong ground”意为“灰尘”,“lightbelong cloud”意为“闪电”,“man belonglong-way place”意为“外国人”……。但是,你可不要以为凭自己的英语可以去那儿独闯天下——他们不会听懂你的英语,你也读不懂他们的“英语”,因为毕竟语法和词汇都有许多变化。

亚-非语系


亚洲的语言还有一个极重要的成员尚未提到,这就是所谓的“亚-非语系”,传统上叫做“闪米特-含米特语系”,简称“闪-含语系”。这名字取自圣经中诺亚的两个儿子,一个叫Shem,一个叫Ham。亚-非语言分布于北非、东北非、近东、中东和中亚的广阔地域,包括有二亿多人口和几十个国家。

然而,亚-非语言之所以重要,原因还不仅限于此。那里不仅是世界上最古老文明的发源地,起源于那里的拼音文字,更是当今世界上大多数主要文字的鼻祖。

亚-非语言中的阿拉伯语人口也占了将近四分之三。其它较重要的语种还有:以色列的国语希伯来语、索马里语、西非/尼日利亚的主要语言豪萨语,以及非洲北部的一些其它语言。

阿拉伯语是将近二十个国家的国语,另外全世界的穆斯林都多少懂几句阿拉伯语,这使它在1974年成了联合国的第六种工作语言。它的字母系统更是被许多其它语系的语言所采用。它的文字保留了几个古代拼音文字的特点:从右到左的书写,以及只有辅音字母没有元音字母。还有一个现象是一个字母在词中的位置不同,写法也不一样。如果你在用X窗口的电脑,可以试试看把编辑器的字体设置成阿拉伯文的字母,再看看把同一个字母放在词中间与放在词尾,形状是否一样。你不需要懂得阿拉伯语就能看得出来。

阿拉伯文共有二十八个字母,都表示辅音。由于它们都写成草体连书,所以看上去一串串的,好像看不出一个个独立的字母。那元音呢?你可能还注意到在这些弯弯曲曲的连续曲线的上下还有不少小点点和短线条什么的,那就是元音!

不幸的是,他们阿拉伯人在书写一般文字时,是省略掉这些元音的,只有在小学课本和给外国人看的读物上才注上元音。举个例子,要写“solid”这个词,他们大概会写作“dls”(别忘了是从右往左写),那你就很难猜这是个什么词了……

阿拉伯文的古老特点是与近、中东文字的起源、演变相联系的。古埃及和“两河流域”是世界上最先出现文字的地方,也是拼音字母的发源地。

大约在五千五百年以前,埃及就出现了文字和书写的纸草。约公元前3100年上下埃及统一,统一后的埃及开始有文字记录可考(这比我国开始有文字记载早了一千七百年)。最早的文字是图形文字,后来有些文字逐渐变成音节符号和指意符号,其后又有了一音一符的字母,共二十四个。所有字母都只标辅音不标元音。各种符号组成词组,共有六百多个词组。经历这些发展的古埃及文字,是用字母、音符和词组组成的一种复合文字。到第八王朝(大约在公元前2200)时期出现了一种草书体,到中王朝(公元前2000-1700年)时草书体已广泛流行,只有正式文体和铭刻才用象形体。

所谓纸草是下埃及产的一种植物,将其茎干剖为长条后,彼此排齐连成片,然后压平晒干成纸。这种纸草后来成为古代地中海地区一种通用的纸,希腊人、罗马人以及往后的阿拉伯人都曾用它书写。(不过,这还不能算是“正式的纸”,因为“正式的纸”必须等到三千年后由中国发明。:-))

早在五千五百年前差不多与埃及人同时,生活在幼发拉底河与底格里斯河(希腊人称为Mesopotamia——美索不达米亚,意即“两河之间的地方”)的苏美尔人(Sumerian)也有了自己的文字。他们最早的文字也是图形符号,一符一义。以后发展为表音符号和指意符号,一起组成词组。自从有了表音和指义符号,字符孳乳增繁的倾向减少,到了约四千三百年前,字符减少到了六百以下,其中约有一百个是表示音节的符号,但是没有单独表示辅音的符号。这种文字用削尖的芦杆、骨棒等刻写在泥版上,晒干或烘干后成为可以长期保存的文书,有一些保存到了现在,并被释读成功。芦杆刻成的笔画,起划粗而深,收划细而浅,形如楔形,因而得名“楔形文字”。

楔形文字后来成为近东各国外交的通用文字,一直到先进的腓尼基拼音文字的“传人”阿拉美文(Aramaic)流行以后才逐渐弃而不用。阿拉美文在近东各国的通行到了公元七世纪阿拉伯的伊斯兰文化兴盛时,又让位于阿拉伯文,直到今日。

腓尼基拼音文字是怎样发明的?

腓尼基人在公元前1500年时居住在现在的以色列、黎巴嫩一带。当时埃及和两河流域的文字早就有一部分发展为音节符号,埃及文字还由此出现标示辅音的二十四个字母。但是两种文字中都有好几百个字符,埃及文字还保持象形体,结构复杂,使用不便。地处使用这两种文字的人之间的腓尼基人受到它们的共同影响,取埃及文的辅音符号而摈弃其象形体,发明出了二十二个辅音字母。从此文字不再为祭司所垄断,从而避免了玛雅文化那样的命运。

与此同时的希腊人,正彷徨于早期从埃及学来的象形-表音混合文字中,到了公元前一千年时,腓尼基文字传入希腊,他们马上放弃了原有的文字,并且又在此基础上进一步发明了元音字母,世界上第一套完整的拼音文字终于诞生了。

腓尼基人的字母系统,是对人类文明的重大贡献。

拼音文字的优点在于它的普及性。一般来讲,学会二三十个字母,就能见字读音。文字越复杂,掌握的人就越少,这对于社会文明的进步非常不利。就文字的复杂程度而言,以象形文字为最,其次为表意文字,形声字又次之,拼音文字最简单。到了现在信息时代,拼音文字因其一维的表达方式又有了一个新的优势(至少目前如此,以后的变化未可知也)。

但同时,拼音文字也有一个大问题,就是许多拼音文字,由于千百年来口语的不断变化,它的书面文字与读音往往相去甚远。拿法语来说,它的书面语言表达的还是四、五百年以前的发音,不发音的元音彼彼皆是,象hommes读为um,aiment读为em。这就是为什么上文说“一般来讲”。

印地安人来自亚洲。大约在二万五千年前有一些亚洲人就开始跨过冰封的白令海峡,逐渐向美洲内地迁移。这似乎不是有目的的移居,所以这过程缓慢得在一代人中间都看不出来。但是到了十六世纪西班牙人到达美洲时,他们已经布满了整个美洲大陆,从阿拉斯加到智利南端的合恩角。据估计那时的人口在一千四百万到四千万之间,操一千七百多种语言,所处的社会形态从狩猎和采集的石器时代到具有高度文明的阿兹台克(Aztec)、玛雅(Maya)和印加(Inca)国家都有。

由于人们认定印地安人来自亚洲,所以自然地把他们的语言和各种亚洲语言作比较。比较的结果,不仅没有找到确定的联系,而且他们内部也不是完全彼此相象的。这说明,第一,二万多年的漫长时光对于语言的变化来说是太长了,我们现在已知的这些语言之间的联系都仅限于数千年的分离;第二,印地安人不是在同一时刻一起来到美洲的,互相之间可能分属不同的民族。

在印地安人中,玛雅人的文字系统是最发达的,玛雅人在公元最初的几个世纪中就发明了文字,符号与解释符号的图形并列,包括很多图形,也有音标和音节符号。这些图形文字看上去极其复杂,好像是一幅幅精致繁复的装饰图案。

西班牙人征服玛雅后,大部分文字记录都被销毁,只有极少数保存到了今天。

这给释读造成很大困难。不过释读研究已在近年取得进展,只可惜文字资料太少,我们对于当时社会情形不能了解很多了。

在玛雅,只有祭司才识字(所以当他们被消灭干净以后就没人能懂玛雅文了!)

,因此祭司们拥有极大的权力,这导致了玛雅人登峰造极的拜神狂热:修建巨大的神殿和祭坛,频繁而繁缛的祭奠仪式,征用大量的人力物力,甚至把最健壮的人用作牺牲。结果,社会生产力遭到很大破坏,加上当时加勒比地区风暴频繁,到西班牙人来到时,各城市已经荒凉破败了……

非洲的语言


“非洲”,指的是撒哈拉以南的“黑非洲”,北非和东北非我们已经在讨论亚-非语系时提到过了,他们的语言即便不是阿拉伯语的话,也是它的近亲。

非洲有好几百种语言,除了亚-非语系以外,还有尼日尔-刚果语系(Niger-Congo)、乍得-尼罗语系(Chari-Nile)、科依散(Khoisan)和另外两个小语系。其中最大的一个语系要数尼日尔-刚果语系,有二亿多人口,接近非洲人口的一半,覆盖了撒哈拉以南的广大地区。尼日尔-刚果语系的一个最重要分支是班图语(支),人口占了全语系人口的一半以上。从西非的喀麦隆到东非的肯尼亚,可划一条“班图线”,班图语就分布在在这条线以南,同时这条线以南的非洲只有一小部分彼此孤立的地区讲其它语言。

语言学研究的结果表明,持班图语言的民族最开始是发源于二千多年前的喀麦隆,也就是班图语言区的最西北角。可能是因为他们从近东地区学会了种植某种农作物后,由于这种作物的适应性,他们随之逐渐朝东、南迁移,最终布满了由此往南的整个非洲大陆。

班图语言中最重要的语种是斯瓦西里语(Swahili),它现在已成为东非最通行的语言,坦桑尼亚和肯尼亚更以它作为官方语言。

在南非(共和国),白人讲的语言叫“阿非利肯斯语”(Afrikaans)

,这是十七世纪的荷兰殖民者带来的,由于好几个世纪的分离,它已经和荷兰语有了不小的差别,所以现在把它们看作两种不同的语言;黑人讲的语言主要是祖鲁语(Zulu)和科萨语(Xhosa),科萨语受附近的一个小语系影响,有一种非常难发的“倒吸气”音:一边吸气一边把舌头上下颤动——你要能象这样发出声音我就服你。“xh”表示的就是这种音。

在现代非洲,和世界上的其它地方一样,较少数人讲的小语言逐渐让位于少数几种大语言。因为对每个人来说,放弃自己的不通用的母语而讲邻近的多数人讲的主要语种,自然对生活会更有用些。

人造国际语系


各国语言的差异成为人们互相交往的一个不可克服的障碍。古往今来,人们就渴望有一种共同语言。特别是在信息化的今天,更需要有一种国际通用的语言,实现人们的互相交流。第一个在国际上获得较大影响的人造语,是由德国教长施莱耶(Schleyer)于1879创造的沃拉普克语(Volapuk)。 1887年波兰人柴门霍夫创造世界语(Esperanto)。世界大同语(Mondlango)。除了沃拉普克语,大同语和世界语之外,其它影响较大的人造语还有:伊多语(Ido),西方语(Occidental),诺维亚语(Novial),英特林瓜语(Interlingua),格罗沙语(Glosa),欧盟语(Atlango)等。

相关分词: 语种