当前位置:首页 > 教育部司局机构

2008年中国语言生活状况报告

一、总貌

2008年,我国语言生活呈现出健康有序、丰富多彩的发展态势语言文字工作深入实际,贴近生活,有序开展;义务教育阶段“语文课程标准”完成修订;汉语国际传播形成规模;法律语言规范水平明显提高;北京奥运会提供几十种语言服务,汉语元素成功运用;非物质文化遗产保护中的语言保护日益引起社会关注;外语在外资企业和外贸中的使用频率和使用范围不断加大。

 

二、领域语言

(一)  语言文字工作

2008年语言文字各项工作稳步推进,取得了重要进展。

语言文字应用管理有条不紊  截至2008年年底,已有25个省(自治区、直辖市)和6个省会市、计划单列市制订修订了当地的语言文字法规和规章,全国语言文字法律法规体系已经形成。通过评估认定,城市语言文字工作达到标准的一类城市有2个,二类城市有50 个,三类城市有79个;省、市级语言文字规范化示范学校共7000余所。参加汉字应用水平测试的人员超过3.7万人。受教育部语言文字应用管理司委托,内蒙古、广西、海南、贵州、云南、西藏、甘肃、青海、新疆等9省(区)举办少数民族教师普通话培班13期,培训少数民族教师1108人。

语言文字信息管理稳步推进  2008年《现代汉语常用词表(草案)》首次以“中国语言生活绿皮书A系列”形式出版。教育部语言文字信息管理司应邀组织专家审定了北京奥运会204个代表团中文名称汉字笔画序表。《奥运体育项目名词》由教育部语言文字信息管理和全国科学技术名词审定委员会联合编译出版。“中华大字符集”一期工程完成。

为落实中央领导同志的有关批示,国家语言资源监测与研究中心监测分析了网络语言、火星文、外国人名等的使用状况,提出了应对策略和建议。该中心还与其他相关单位联合发布了“2008年度中国主流媒体十大流行语”,多家媒体转载。

中国语言资源有声数据库建设试点工作在江苏省苏州市启动。采录工作在苏州城区、常熟市、昆山市3个点展开。

民族语言文字工作取得新进展  清华大学研制的“统一平台少数民族文字识别系统”获2008年“钱伟长中文信息处理科学技术奖”一等奖。国家民委有关部门在新疆察布查尔锡伯族自治县双语环境示范区举办了第二期锡伯语言环境建设培训班,在贵州松桃苗族自治县双语环境示范区举办了苗文创制试行50周年纪念表彰活动。新疆语言文字维汉双语网站开通。

手语工作  中国残疾人联合会和北京奥林匹克运动会组织委员会编印了《北京奥运会和残奥会常用手语》。在教育部支持下,印发了《“十一五”期间在全国部分聋校开展推广〈中国手语〉试点工作方案(2008年―2010年)》。

(二)  语言教育与传播

义务教育阶段“语文课程标准”的修订工作顺利完成。修订后的“标准”进一步强调了“读书”在语文学习和思想文化养成中的关键作用,适当降低了第一学段“写话”的难度,推出了321字和2 500字两份汉字学习字表。

汉语学习热潮持续高涨,汉语国际传播形成规模。2008年全球开设汉语课的大学有3 500所,英国、法国、德国、俄罗斯、韩国、泰国、越南、印度尼西亚、马来西亚等国家将汉语纳入本国国民教育体系。孔子学院(含孔子课堂)已开办305所。国家汉办等相关单位派出的汉语和人文社会科学类教师1 557人,分布世界109个国家。

(三)  法律语言规范

全国人民代表大会常务委员会法制工作委员会改变法律草案的审读方式,将原来的“文件对文件”方式,改为“专家对立法者”的面对面审读。2007年和2008年我国法律文本均为规范汉字,符合《国家通用语言文字法》的相关规定。

(四)  语言保护与社会和谐

文化部2008年向国务院报送的《非物质文化遗产保护法草案(送审稿)》,已经列入全国人民代表大会立法程序。国务院公布了《第二批国家级非物质文化遗产名录》(共510项)以及《第一批国家级非物质文化遗产扩展项目》(共147项)。2008年“文化遗产日”展示了福建高甲戏、山东柳琴戏、浙江婺剧、安徽傩戏等传统戏曲。人们在欣赏这些地方戏曲的同时,也接触了这些戏曲赖以表达的方言。

 

  年度语言热点

2008年是不平凡的一年,语言热点迭现。

北京奥运会多种语言使用  北京奥运会共有来自世界204个国家和地区的11000多名运动员,北京残奥会共有来自148个国家和地区的4200多名运动员,参赛国家和地区及运动员人数均创历届之最。奥运会期间,奥组委共提供了55种语言服务,涉及奥运竞赛场馆、非竞赛场馆、服务场所、新闻发布厅、呼叫中心、机场、气象局、赛时官方网站等,多语服务为运动员提供了便利,保障了运动会的顺利进行。

地震灾后心理援助用语  汶川大地震发生后,灾区居民发生惊恐、焦虑等心理问题的约占47%,发生急性应激障碍的达20%。中央及不少省、自治区、直辖市派出由心理干预专家组成的心理救援队伍进入灾区服务,但是遇到了因方言障碍导致沟通困难等问题。为此,四川省卫生系统对心理治疗骨干进行了心理援助用语技巧培训。实践证明,正确使用语言对灾后心理救援至关重要。

从改革开放30年流行语的变化看社会变迁  中国自1978年实行改革开放至2008年的30年间,流行语发生很大变化,从一个侧面揭示出中国社会观念和社会生活的诸多变化和发展。譬如,“三大件”在上世纪70年代,是指手表、自行车和缝纫机,是当时人们渴望得到的最昂贵的家用商品。在80年代,“三大件”逐渐被“新三大件”――电视、冰箱和洗衣机所取代。90年代,“三大件”又更新为电脑、空调和摩托车。现在,由于社会的变迁,曾经红极一时的“三大件”早已退出“流行”行列。

    奥运会汉语元素彰显  北京奥运会开幕式上的“和”字表演,通过古今字体演化,表达了孔子“和为贵”的理念。奥运会运动员入场顺序依照各代表团名称简化汉字笔画顺序排列,体现了主办国的文字政策国际奥委会罗格主席在奥运会开幕式上,用汉语说出“感谢你!”,国际残奥委会主席克雷文在残奥会闭幕式上,引用 “有朋自远方来,不亦乐乎!”,并用汉语说:“谢谢香港!谢谢青岛!谢谢北京!谢谢中国!”引起会场观众的震撼和共鸣。

C人名案  江西青年“赵C”在办理更换第二代身份证手续时,因名字中的“C”不符合公安部《关于启用新的常住人口登记表和居民户口簿有关事项的通知》中相关规定,未能获准办理。他将鹰潭市公安局月湖分局告上法庭,法院判赵C胜诉;公安部门据《居民身份证法》和《国家通用语言文字法》相关规定提起上诉,经过法庭调解,赵C同意选取规范汉字改名。“赵C事件”圆满解决。这是2008年中国十大影响性诉讼之一,突显了个人姓名权与姓名管理规范之间的矛盾,引发社会各界热议。

网络语言及“山寨”“雷”“?? 据国家语言资源监测与研究中心的一项调查,122个网络词语在2005年至2008网络媒体、平面媒体和有声媒体中的使用频率并不高,而且在网络、平面和有声三种媒体中呈依次锐减的趋向。全民通用语言仍是网络媒体语言传播的主体,日常词语在网络语言中占主流。

“山寨”一词有“民间、模仿、非主流”等意义,并在社会热用。“雷”有动词或形容词的某些功能和特点,表示由某种意想不到的人或事而带来强烈冲击或受到巨大震撼,就像遭雷击一样。“??”的字形常被网络借用来表达一种愁苦相或倒霉相。这三个词的新义和新用法,折射出网络时代丰富多彩的社会生活图景。

 

、报纸、广播电视、网络(新闻)语言文字使用的若干数据

报纸、广播电视、网络(新闻)的年度用字用语调查是国家语言资源监测与研究中心每年都进行的常规调查。此次调查是在国家语言资源监测语料库(包括平面媒体、有声媒体、网络新闻)2008年度的语料上进行的,共计1 374 157个文本文件,1 209 676 776字符次(包括标点、符号及西文字母、数字等出现的次数),其中汉字出现991 717 791次。

(一)汉字使用情况

1.高频汉字数量稳定,年度特色用字使用频率增高

语料库中共出现了9 271个字种,高频汉字包括覆盖率达到80%90%99%的汉字,其字种数分别为6049712384个。

体现2008年特色的汉字“灾 橘 汶 震 奥 寨 舰 运 川堰 浪 炬 救 墟 旗……”等,使用频率值增大,在汉字的频序表中,排序位置有较大幅度的前移。

22008年度用字总表与现行规范字表之间的差异与往年特点相同,即每年的用字总表与现行规范字表之间的差异大于年度字表之间的差异

与《现代汉语常用字表》的一级字比,2008年度用字总表前2500字相差344字;前3500字与《现代汉语常用字表》比,相差397字;前7000字与《现代汉语通用字表》比,相差609字。《现代汉语通用字表》中未在2008年度用字总表中出现的汉字共计197个。

2008年度用字总表中,包括了繁体字、异体字、不规范的类推简化字、旧计量单位用字、日本汉字、韩国汉字等共计1379个,占全部年度用字的14.87%,其中一些用在专名中,另一些属于错用别字。

2008年、2007年、2006年三个年度的共用字共计7882个。每个年度的独用字均属于低频偶发,大多用于人名、地名、机构名等专名中。

频次小于等于10的低频字出现在年度用字总表的6745位之后。

(二)词语使用情况

1年度间词语使用的变化很大,但高频词语使用稳定

本次调查中由分词软件对语料切分得到的字符串的总数计 797 784 136词次。其中标点、符号等出现 98 998 599次,总词语数共计565 064 223词次,词种数计2 261 272 个。

年度间词语使用的变化很大,2008年度与2007年度、2006年度的词语使用情况相比,共用的词语共计480 400个,占年度词语使用量的21.24%

2008年度覆盖率达到90%的高频词语共计12490个,与2007年度、2006年度高频词语相比,共用的高频词语共计10896个,占2008年度高频词语的85.96%,这说明高频词语使用稳定。高频词语的词长分布在1字到9字之间,其中词长为2字、3字的词语占全部高频词语的80.72%高频词语的用字稳定在2600个左右。

2008年高频独用的词语凸显了2008年的年度特色,反映了当年的社会热点。如“抗震救灾 汶川 山寨 增兵 过冬 寨 羌 试航 新闻中心 北川 三鹿 麦凯恩航天员 达赖 余震 三聚氰胺 欧洲杯 加沙城 堰塞湖 都江堰 重灾区 雪灾 梅德韦杰夫 奥运村 抗灾 盲区 婴幼儿 倒闭 雷曼 冰冻……”等。

2.成语习用语的使用

语料中使用的成语种数为4 033个,总次数为1 732 395次。成语的词长分布在3字到8字之间,其中4字词占全部成语种数的97.79%

3流行语

2008年度中国媒体十大流行语”分为7个常设类别和7个年度特色专题,共14组,每组选取最流行的十大流行语发布。其中常设类别有综合类、国际时政类、国内时政类、经济类、科技类、文教体育类、社会生活类,特色专题有“民生”、“金融”、“北京奥运”、“汶川地震”、“海峡两岸”、“改革开放30周年”、“社会问题”等。2008年是极不平凡的一年,流行语真实记录了该年度令人难以忘怀的国内外非常事件与重大问题,记录了这一年中国主流媒体和百姓的关注焦点,铭刻了中国各族人民的喜怒哀乐以及国际上的风云变幻。

4.新词语

新词语是语言监测研究永恒的主题。2008年共采集了359条新词语。

从语言学角度看,2008年度新词语有以下几个特点:从词语长度看,三、四字词语占优势,三字词语占47.63%,四字词语的比例为27.85%就构成材料看,359条新词语以汉字为主体,同时兼有多样。 就结构方式来看,后附加式数量增多,如“~门、~族、~令、~客、~奴、~症”等。另外2008年新词语中叠音方式构成的词明显增多,如“范跑跑、郭跳跳”。就使用频次来看, 2008年度新词语分布状况是两头小,中间较大。特别高频和特别低频的词都不多。

从社会语言学角度来看,2008年度新词语有两个明显的特点。一是重大社会事件催生新词语“群”。2008年中国发生了一系列重大事件,这些事件催生了一簇簇新词语“群”,如“512地震”词语群、“北京奥运会”词语群、“金融危机”词语群等。二是网络助推了新词语的产生和发展。359条新词语中,来自网络的有66条。其中以反映社会生活的居多,且形成几个较大词族,如“山寨”(山寨版、山寨帮、山寨春晚)、“雷”(雷剧、雷人、雷语)等。这些词语先在网络出现,很快渗透到其他媒体,显示了网络语言很强的渗透力。

 

五、中文网络用字用语专项调查数据

中文网络用字用语专项调查是在国家语言资源监测与研究中心网络媒体监测语料库2008年的语料上进行的。语料分为网络新闻语料、博客语料、BBS语料三类,共计2 742 239个文本,1 162 050 095字符次,其中汉字出现903 677 944字次。

新闻语料来源于新浪新闻、QQ新闻,博客语料来源于新浪博客、 搜狐博客,BBS语料来源于清华大学、中山大学、华中师范大学三所高校的BBS和天涯社区、搜狐社区、网易论坛三个社会BBS网站。

调查中由使用的网络用语表包含126个网络用语,调查内容包括网络用语的使用频度,网络用语在新闻、博客、BBS中的使用情况对比等。

12008年使用频次最高的十个网络用语为:“顶”、“帖子”、“偶”、“楼主”、“山寨”、“灌水”、“555、“沙发”、“版主”、“mm”。

22008年新出现的网络用语使用频率相对都较高,而某些往年出现过的网络用语在2008年语料中出现次数很少或者没有出现。

3BBS语料中使用的网络用语的频次大大高于新闻语料和博客语料。新闻语料中网络用语的总频次主要来源于极少数高频网络用语,如“山寨”。

4、网络用语表中的网络用语分为以下4种类型:字母型、数字型、汉字型、混合型。其中汉字型的网络用语平均频次最高,说明汉字型的网络用语使用更频繁。

 

六、基础教育新课标历史、地理教材的用字用语数据

依据“发行量较大、使用范围较广、影响面较大”等因素及教材搜集的情况,选取了人民教育出版社、华东师范大学出版社、北京师范大学出版社、四川教育出版社的四套教材作为“历史”课教材的调查对象;选取了人民教育出版社、湖南教育出版社、中国地图出版社的三套教材作为“地理”课教材的调查对象。

1.汉字使用情况

历史教材共计1 456 300字符次,其中汉字1 233 895字次,汉字字种4379个。地理教材共计398 361字符次,其中汉字334 129字次,汉字字种2956个。汉字总次数与教材容量、册数的多少有关,但历史教材的字种数比较多,主要原因是与知识内容有关。调查将历史、地理两种教材用字频率分布进行对比,两科教材的用字总次数与字种数相差比较大,但常用字累加频率的使用汉字数却比较接近。累加频率在50%80%90%时,历史教材用字分别为159562938个,地理教材用字分别为112397682个,所用汉字数随着累加频率的递增而增加,并表现出大致相当的增加幅度。

调查对两类教材的用字进行比较,反映了它们共用字与独用字的情况。两类学科教材用字与《现代汉语常用字表》的比较也是本次调查一个亮点。

2.词语使用情况

通过分词,历史教材得到词语总数698 794个、词种数39 982个。地理教材得到词语总数190 280个、词种数13 925个。词语频率分布上,两类教材在每一级的累加频率等级上都出现了同步的增长,但历史教材的高频词更为集中,专名更多。另外,经统计,共用词在两类教材中占的比重相差非常大。

调查还将两类学科教材与语文教材用词进行了比较。调查结果显示,随着学科知识的扩大,词汇分布面越来越宽,复现率越来越低,词语分布更为稀疏。

2009年,海外华语研究中心对东南亚主要华文媒体的语料进行了用字用语的调查。

 

         (《中国语言生活状况报告(2008)》已由商务印书馆出版发行。)

 

收藏