学前英语语料库建设研究
所属栏目:学前教育论文
发布时间:2019-08-05 11:23:21 更新时间:2019-08-05 11:23:21
【摘 要】近年来,随着语料库语言学的不断发展,很多专门用途的英语语料库应运而生。但对于学前英语语料库建设的研究还处于空白阶段。本文介绍了语料库的定义和分类,阐述了学前英语语料库建设的必要性,探讨了学前英语语料库建设的设计思想和具体方法,以期对学前英语语料库的建设有所裨益。
【关键词】学前英语语料库;建设;设计思想;具体方法
一、语料库的定义
语料库的英文是“corpus”,有“全集”的意思。学者们对语料库的具体定义不尽相同。学者 John Sinclair 认为:“语料库是按明确的语言学标准选择并排序的语言运用材料汇集,旨在用作语言的样本”[1]。我国学者俞士汶提出:“在现在语言学的意义上,对语料库的认识应该包含以下三点:语料库中存放的是在语言的实际使用中真实出现过的语言材料;语料库是以电子计算机为载体承载的语言知识的基础资源;真实语料需要经过分析、加工、处理,才能成为有用的基础资源”[2]。从学者们对语料库的定义,我们可以归纳出:语料库是一个按照一定的标准采集而来的,能够代表一种语言或者某种语言的一种电子文本集。
二、学前英语语料库建设的必要性
学前英语语料库建设的必要性体现在以下两个方面:第一,学前英语语料库的建设为学前英语教学提供了新思路和新途径,对学前英语教学的理论、内容和方法等不同方面均产生极大的影响。首先,学前英语语料库为学前英语教学提供大量生动的教学范例。其次,学前英语语料库还为学前英语教学课件编写提供新的教学资源。第二,学前英语语料库作为一种辅助性工具,它为从事学前英语研究的学者们提供学前英语的词汇、语法、篇章等各个层面的语料,使他们的研究可以更系统和深入,从而使他们的研究成果更具解释力和信服力。总之,学前英语语料库的建设与学前英语教学和研究紧密结合,是推动学前英语发展的一种必然。
三、学前英语语料库建设的总体设计
1.建库目的语料库的建设必须有明确的目的,因为不同的目的和用途决定了语料的类型、语料库的大小和基本结构。要明确目的,首先要明确的是其基本用途和应用范围。学前英语语料库的建设主要是满足学前英语教学研究、学前英语翻译研究和学前英语语言学研究的需求,其应用范围包括学前英语信息查询、学前英语教学、学前英语教材编写、学前英语翻译研究、学前英语词典编撰等领域。
2.语料库规模学者 Kennedy,1998 指出进行句法研究和高频词汇的研究一般要求语料库规模在 50- 100 万词次之间。根据学前英语语料库的使用目的,学前英语语料库初步设计容量规模为 100 万词次的语料库,抽取 500 篇每篇长度约为 2000 个词左右的样本,取样时间跨度为 1990 年至今,其后根据现实需要继续扩展。
3.语料库结构学前英语语料库的建设在参考中图分类及国内院校开设学前相关专业的主要课程设置的基础上,主要由以下六个模块组成:(1)学前教育学科模块,具体包括:学前教育学、学前心理学、学前儿童发展心理学、中外学前教育简史;(2)学前教师教育模块,具体包括:幼儿园教育活动设计与指导、学前儿童教育(学前儿童社会教育、学前儿童语言教育、学前儿童科学教育、学前儿童健康教育、学前儿童艺术教育);(3)学前游戏模块,具体包括:学前儿童游戏、儿童游戏通论、幼儿园环境创设、幼儿玩具制作与指导;(4)学前儿童保健模块,具体包括:学前卫生学、幼儿营养学、儿童生活保健、儿童心理保健;(5)学前儿童文学模块,具体包括:学前儿童文学、中外优秀儿童文学赏析、幼儿文学创作;(6)幼儿园管理模块,具体包括:幼儿园管理、幼儿园经营与管理、幼儿园组织与管理、幼儿教育政策与法规。
四、学前英语语料库建设的具体方法
1.语料抽样关于抽样,我国学者郭曙纶指出“选取语料首先需要在实际使用的语料中确定一个范围,称为母本;被选入库的语料称为样本。由母本取得样本的过程叫作抽样”[3]。学前英语语料库的建设是在确定学前英语语料库规模的基础上,根据统计学原理进行科学抽样,使所建的学前英语语料库达到总体效度的标准。要进行学前英语语料库的抽样首先需要考虑语料库抽样的范围、抽样的原则和抽样的方法。
2.语料标注我国学者杨惠中列举了标注的几种层次:“(1) 经过格式属性标注,如段落、字体、字号进行标注;(2)对识别信息进行标注,如作者、体裁、语域以及词性等标注;(3)特殊标注,如特殊赋码等”[5]。语料标注的过程丰富了电子文本语料库的内容,经过标注的语料库被赋予了各种语言信息,同时扩展了语料库在语言学分析上的潜在用途,其意义是不言而喻的。语料的标注是学前英语语料库建设的重要环节,也是体现学前英语语料库建设水平的重要标志。
3.语料来源学前英语语料库的建设采用现有的以电子形式存在的语料为主,键盘手工输入语料和光学扫描语料为辅的数据获取方式。在实际建库时,要注意以下两个方面:(1)在采用现有的以电子形式存在的语料为语料来源时,必须对以电子形式存在的语料进行细致、严格的校对;(2)通过键盘手工输入语料时,容易出现错误,后期需要用拼写和语法检查功能进行校正。
4.数据管理方式语料库的数据管理方式是指借助计算机进行的语料的管理。以 XML 语言作为语料文件的组织格式是国际上的主流格式。学前英语语料库的建设也应采用这种文件管理方式,原因在于 XML 格式的文件管理方式的以下三个主要特征:“高度灵活,扩展性强,其自身并不包括任何预设的标签,而是由使用者自己设计;XML 文件结构完整,句法严谨;适用于意义的描述,而不是格式的呈现”。
五、结束语
学前英语语料库的建设为学前英语教学提供了一个全新的思路,也为从事学前英语研究者们提供一个分析和研究学前英语的载体。但语料库的建设是一个繁杂而精细的系统工程,需要大量的人力物力。本文仅对建库几个主要步骤进行了探讨,更详细具体的建设思路和方法还需要继续完善,期望对学前英语语料库的建设有所帮助。
【参考文献】
[1] John Sinclair. Corpus Concordance and Collocation[M]. England: Oxford University,1991:185. [2]俞士汶. 语料库与综合型语言知识库的建设[M]. 北京:科学出版社,2003:7.
相关推荐:小学英语课题研究容易做吗