基于语境的四六级英语辅助学习系统设计:

  摘 要:根据大学生英语学习的要求,结合英语单词语义环境的特点,设计开发了四六级辅助学习系统。该系统根据输入的英语单词,借助数据挖掘的语义相似度,查找出相似度较高的英语单词以帮助学生理解所学习的英语单词,并给出了相应的例句、词块及语料。通过实验得到了较理想的结果。�
  关键词:语境;英语学习;语义环境;学习系统�
  中图分类号:TP319 文献标识码:A 文章编号:1672-7800(2012)003-0105-03��
  �
  作者简介:唐晓晴(1991-),女,淮阴工学院计算机工程学院软件本科生,研究方向为软件工程;陆富国(1990-),男,淮阴工学院计算机工程学院本科生,研究方向为软件工程;王忆清(1991-),女,淮阴工学院计算机工程学院本科生,研究方向为软件工程;马涛(1990-),男,淮阴工学院计算机工程学院本科生,研究方向为软件工程;李东辉(1990-),男,淮阴工学院计算机工程学院本科生,研究方向为软件工程;刘金岭(1958-),男,淮阴工学院教授、硕士生导师,研究方向为数据库技术、数据挖掘。
  
  
  0 引言�
  2006年12月,四级考试改革全面启动,教育部出台的《大学英语四六级考试改革方案》调整了四、六级考试的题型结构和分值,命卷人已经悄无声息地将对词汇的考察融入细节题中,单纯的词汇测试改为“篇章语境中的词汇理解测试”。这一改革举措对大学生英语词汇的掌握带来了深刻的变化,对考生提出了更高的要求。马林诺夫斯基(B. Malinowski) 指出:“没有语境,词就没有意义。”只有将词放到语境中去理解,才能理解它的确切意义。吕叔湘先生也在论述关于语境与词汇学习的关系时指出:“词汇要嵌在上下文里头才有意义,才容易记住,才知道用法。”由此可见脱离语境一味地死记硬背单词,单词也会如同泡沫一样,很快从记忆中消失;反之,在语境中记忆词汇,比如通过阅读四六级英语阅读资料等,既可以培养自己通过上下文意义猜测生词的能力,提高阅读能力,又可以获取知识与信息,可谓一举多得。如: I can not open the can中的第一个can 的概念意义是“能够”,第二个can 的概念意义是“罐头”。不仅词的概念意义与“语境”有密切的关系,词的内涵意义与“语境”也有密切关系。英语中有很多词有内涵意义,内涵意义是词的字面以外的意义。如:Home 的字面意义是“居住之处,但它含有‘温暖、舒适’”内涵意义。词的内涵意义应放到词的具体“语境”中去领会。借助语境及上下文,可以瞻前顾后,纵览全局,依赖情景语境确定词义,例如“Odds”一词,作“可能性”、“困难”、“(与… )不合,争吵,不一致”等含义。�
  If you are male, the odds are about 1 in 12 of being colorblind(如果你是男性,患色盲的可能性在1/12左右)。�
  She has overcome enorm ous odds to get where she is today(她克服了巨大困难才取得今天这样的成就)。�
  Burts" latest evidence is at odds with his earlier statem ents.(伯特的最新证据与他早先的说法有矛盾)。�
  即使学生掌握某一词的诸多意义和用法,倘若只有一个孤立的“Odds”,却无语境以及上下文,也无其它外界的暗示与提示,这样的话,学生依然迷惑不解。本文是把英语词汇与语篇语境相结合,使学生通过语境更加深刻地理解多个同义词及每个单词的用法和多种意义,从而对于单词的记忆更加牢固。�
  1 基于知网(HowNet)的语义距离�
  《知网》是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间以及概念所具有的属性之间的关系为基本内容的常识知识库。�
  《知网》一共采用了 1500个义原,这些义原分为以下几个大类:①Event(事件);② entity(实体);③attribute(属性值);④aValue(属性值);⑤quantity(数量);⑥qValue(数量值);⑦SecondaryFeature(次要特征);⑧syntax(语法);⑨EventRole(动态角色);�B10�EventFeatures(动态属性)。�
  这些义原可以归为3组:第一组,包括第一到第七类的义原,称之为“基本义原”,用来描述单个概念的语义特征;第二组只包括第八类义原,称之为“语法义原”,用于描述词语的语法特征,主要是词性;第三组包括第九和第十类义原,称之为“关系义原”,用于描述概念和概念之间的关系。在《知网》中,词语语义描述具有如下特性:①每个词的语义描述由多个义原组成;②在词语的语义描述中,各个义原并不是平等的,它们之间有着复杂的关系,通过一种专门的知识描述语言来表示。�
  义原之间组成了一个复杂的网状结构,而不是一个单纯的树状结构。义原关系中最重要的是上下位关系。根据义原的上下位关系,所有基本义原组成了一个义原层次体系,该义原层次体系是一个树状结构,可以得到一棵义原概念树,它是本文进行语义相似度计算的基础。�
  设义原集�合为M,义原数量表示为|M|,义原用p�i表示,i=1,2,…,|M|。�
  设Li为义原pi在概念树中的深度,y 为距离初始阈值,x为满足不等�式max�(L)   本系统利用语境以及上下文的帮助,使学生能准确无误地理解此词的确定意义。因此, 某个词语只有与其它的词语同现,构成一个具体的、统一的有机体,这个词才被赋予了生命, 此多义词在某个特定具体的语境里的意义才能在学生的脑海中跃然而出。�
  2.1 学习系统的主要功能及数据库结构�
  本系统是根据英语四、六级学习的实际需求而开发的,要求稳定、可靠地实现英语学习资料的自动化管理,主要实现的功能如下:�
  (1) 单词信息的查看,包括单词的基本信息,如单词、音标、词性、释义等。�
  (2) 经典例句及解释的显示,包括例句、解释、资料来源等。�
  (3) 英语原文和翻译的查看,包括英语原文、原文翻译等。�
  (4) 在线答题,将会显示与该单词相关的部分真题,在线答题的功能。�
  数据�库(YLK_data)结构如下:�
  单词实体集的关系为:WORD(单词编号,音标,词性,释义,词组)。�
  英语文章实体集的关系为:eARTICLE(文章标号,题目,内容,来源)。�
  文章翻译实体集的关系为:cARTICLE(文章标号,题目,内容,来源)。�
  考题实体集的关系为:KAOTI(标号,题干,选项A,选项B,选项C,选项D,答案,来源)。�
  2.2 学习系统主要算法及主要界面�
  
  3 结束语�
  英语四六级辅助学习系统实现了单词信息的搜索、经典例句的查看、英语原文和原文翻译的查看、在线答题等功能。利用了文本数据挖掘的技术,将查询相似度较高的单词列出来,以帮助学生理解、掌握。
  参考文献:�
  \[1\] 董振东,董强.知网\[EB/OL\].www.省略/zhiwang/c_zhiwang_r.html,2008-10-04.�
  \[2\] 刘群,李素建.基于《知网》的词汇语义相似度计算\[A\].第三届中文词汇语义学研讨会论文集\[C\].台北:台北中央研究院,2002.�
  \[3\] 刘金岭.基于语义的高质量中文短信文本聚类算法\[J\].计算机工程,2009(10).�
  \[4\] 刘卫,刘金岭.基于《知网》的词语语义相似度改进及应用\[J\].福建电脑,2010(5).�
  (责任编辑:杜能钢)
  
  ���
   A CET 4&6 Guidance System Base on Context
  ��
  Abstract:According to the the characteristics of students learning English and English words semantic characteristics of the environment,it designs and develops a CET 4&6 guidance System. The system according to the input of the English words, by means of data mining, semantic similarity, high similarity to find out the English words to help understand the learning of English words, and the corresponding sentences, words block and corpus. Through experiments to be more satisfactory results.�
  Key Words: Context;English;Guidance;System

推荐访问:语境 英语 四六级 辅助