学习者个性化特征表示相似度计算

更新时间:2024-04-02 作者:用户投稿原创标记本站原创 点赞:31180 浏览:144350

【摘 要】

学习者的相似性反映了学习者之间相近的学习经历,将相近者组织成一个具有共同学习兴趣和目标的共同体,可以增强虚拟学习社区中各组成要素的耦合与连接,提高学习者的学习效果和黏度.本文基于领域本体提出一种能够描述学习者个性化特征的V模型,并以此为数据结构,设计了一种能有效计算学习者相似性的算法.实验结果表明,利用概念之间继承和包含关系,算出概念相关度,能快速计算出学习者特征向量之间的相似度;得出的结果较好地反映了专家分组经验,为提高虚拟学习社区的个性化和智能化提供了关键技术支持.

【关 键 词】领域本体;知识库;个性化特征;学习者相似度

【中图分类号】TP391【文献标识码】A【文章编号】1009―458x(2014)02―0032―05

一、引言

当今,人类社会已发展到知识经济时代,学习交流成为个人的立世之本、生存之道.基于计算机和网络技术的虚拟学习社区是人们进行远程学习的一种重要方式,它使得任何人可以在任何时间和任何地点学习任何需要的知识.在传统教育中,学习活动往往以集体方式进行,学习者不但有经验丰富的教师进行现场辅导,而且容易得到他人的认同,同学之间的交流讨论也能有效促进其学习水平的提高.而在虚拟学习社区中,由于教师、学习者和学习集体处于分离状态,使得学习者较难克服学习中遇到的障碍,常常感到无助和孤独,进而产生挫败感和厌学情绪,降低学习的热度和效率.显然,通过在学习平台上突出对学习者学习过程的引导,推荐最佳学习伙伴,自动将相近者组织成一个具有共同学习兴趣和目标的共同体,可以增强虚拟学习社区中各组成要素的耦合与连接,提高学习者的学习效果和黏度.

二、国内外研究现状

目前,国内外对虚拟学习社区的探索大多局限于概念界定、学习策略和学习模式研究等理论层面,对于理论实现层面的关键构建技术研究相对较少.例如HopeN.Tillman提出了虚拟学习社区的定义和特征[1];赵建华和李克东阐述了基于协作方式的教学设计[2];黄怀荣探讨了CSCL的理论和方法[3].虚拟学习社区中的协同就是实现学习者之间的交互,而从本质上讲,交互是由资源构成的,资源是构成交互的资源,离开交互的资源是毫无意义的[4].以学习者之间交互的资源为载体,将学习行为中发生的资源交互映射到语义层中的本体概念,学习者之间的相似性问题就转换为计算概念之间的相似度问题.关于本体概念之间相似度的度量方法有多种,例如:Tervsky提出了基于概念属性的语义计算方式[5];Leacock提出了基于结点距离的语义相似度计算方式[6];LinD提出了基于信息内容的语义相似度计算方式[7].这些方法对于计算概念相似度具备一定的指导意义,但还需针对具体应用背景,进一步考虑各种因素,提高概念相似度的准确性.

三、学习者个性化特征表示

学习者模型是记录学习者情况的一种数据结构,是对学习者信息的抽象描述和表示.它根据学习者学习过程中的学习行为和练习测试结果,分析学习者的知识水平、认知能力、学习动机、学习风格和学习历史变迁等信息的特征[8][9].由于本研究的重点是学习社区中学习者兴趣和认知能力的相似度,以便为虚拟学习社区中的学习者推荐最佳学习伙伴和提供个性化怎么写作,因此学习者模型主要突出描述的是学习者的认知状态及个性化兴趣偏好信息.学习者模型表示的方法与所学领域知识是紧密相关的,领域知识的构建运用本体来建模,因而学习者个性化特征表示也采用本体方式.

1.基于本体的知识库构建

知识库作为学习资源的组织和管理核心,其构建可分为两个部分来进行:知识空间和信息空间[10][11].知识空间是语义层,信息空间中学习资源通过映射到知识空间获得语义,知识空间利用本体来建模.起源于哲学的本体是对领域知识的概念化、形式化、明确化描述[12].概念是对领域中可以标识的事物描述的集合,本体就是用特定领域的概念以及这些概念之间的关系来描述概念之间的语义.概念之间的关系通常是多对多关系,把概念当作结点,关系看成边,组成本体图.在具体应用中,可以结合实际需要,进行适当的约束和简化.在此,将领域知识中的知识点按照一定粒度抽象成概念,其关系主要是派生和包含关系,而学习资源则可隶属于某些概念,组成概念树型的学习资源组织结构,如图1所示,其中Ci表示本体中的概念,LRkj代表与某些概念相关的学习资源.


图1知识库中的学习资源组织结构图

2.基于本体的V表示学习者个性化特征

向量空间模型(V)在文本分类中具有广泛应用,其基本思路是利用一个关 键 词组成的向量近似描述文档内容,由于关 键 词具有随机性,造成向量的空间维度一般较高,且关 键 词之间被认为是线性无关的.

在虚拟学习社区中,由于学习者的兴趣和行为大多围绕学习资源展开,因此根据其交互的资源来分析和理解学习者的兴趣和认知能力是一种有效的策略.学习者对某一个学习资源感兴趣,其背后隐藏的是对某一个知识点感兴趣,利用知识库中本体概念对学习资源的标注作用,可以将学习者的特征描述从信息空间层迁移到知识空间中的语义层,即领域本体层.本体中的概念存在关系且数目较少,可以较好地克服V模型中向量维度较高,且线性无关的缺点.

定义1.学习者的学习行为(浏览,下载,上传,提问,评论,答疑,测试等)组成学习信息对象集合SB等于[{bi0≤i≤M}],M表示对象总数;每个bi可以表示成一个向量v等于{(c1,a1,v),(c2,a2,v),等(ct,at,v)},ct表示本体中的概念,at表示学习行为,v表示学习行为的分值;所有学习信息对象的集合构成特征向量,V等于{(c1,v(c1)),(c2,v(c2)),等(ck,v(ck))},k表示该学习者感兴趣的学习主题数.

3.学习者特征的获取与量化在一个开放的虚拟学习社区中,学习者往往要经过注册才能成为正式成员,其主要学习行为有浏览资源、下载资源、上传资源、提问、评论、答疑、练习测试等.通过对这些学习行为进行分析,不难得出他们的兴趣点;不同的学习行为反映出内在的兴趣度和认知能力不一样,在量化过程中要体现出差异.

特征获取途径主要有以下几种:

(1)学习者在注册时自行设置几个核心概念和反映兴趣浓度的分值来描述其兴趣.这可以很好地解决系统冷开始的问题.

(2)记录学习者的链接点击行为,点击后学习者会浏览此学习资源.

(3)在学习者上传自己认为较好的学习资源到知识库的过程中,可以强制其利用领域本体标注此学习资源.学习者能够上传某个学习资源,体现其对此方面的知识较为熟悉.

(4)学习者提问的内容,能较好地反映其兴趣点,问题到概念的映射可以自动标注,也可以强制学习者手动标注.

(5)学习者对某个学习资源发表评论,说明学习者对该学习资源背后的知识点较为熟悉.

(6)学习者能对某个问题答疑,且提问者能根据其答疑结果决定是否结题,反映出答疑者对此问题具有深入的研究.

(7)学习者的练习测试能反馈出其对某个知识点的兴趣特征和认知能力特征.

学习者不同的学习行为表示其对某个知识点的兴趣度和掌握程度是不一样的,必须根据不同学习阶段划分类别.在此,类别特征被划分为{关注,兴趣,了解,理解,应用}5个级别,对应分值为{1,2,3,4,5}.

四、学习者相似度计算

1.基于本体的概念相关性

一般而言,从图论的角度看,领域本体概念之间的关系是一种多对多关系,表示的是一个图结构.在虚拟学习社区中,知识库组织和管理核心本体概念所对应的知识点是一种派生的继承关系和整体-部分的包含关系,在此可以将其看成是一种特殊的图结构――概念树.

定义2.若CX和CY为概念树中任意的两个概念,则它们之间的最小边数,称为语义距离,记作D(CX,CY).

不难看出,两个概念的语义距离越小,其相关度越小;反之,则相关度越大.且D(CX,CY)满足:①非负性:D(CX,CY)[≥]0;②同一性:D(CX,Cx)等于0;③对称性:D(CX,CY)等于D(CY,CX).

在本体概念树中,若两个概念离根越远,表示语义越具体,则两个概念越相近.

定义3.Depth(C)为概念树中概念C的深度,Depth(root)等于1,Depth(C)等于Depth(CParent)+1,其中root表示根概念,CParent为概念C的父概念.

定义4.CA(CX,CY)表示概念CX和CY共同祖先集合;NearestCA(CX,CY)为它们的最近共同祖先.

显然,同样语义距离的两个概念,它们的最近共同祖先的深度越大,说明它们之间的重合度越好,相关度越高.依此原理定义如下两个概念之间的相关度:

其中,CX和CY为概念树中任意的两个概念,[a]为调整因子.

2.概念值的归一化处理与点积运算

量化之后,学习者对概念认知程度值在区间[0,5]之间.概念间的相似度是一个取值[0,1]的数值,如果不在这个范围,要进行归一化处理.为此我们定义概念值之间的点积运算如下:

其中,CX和CY为概念树中任意的两个概念,[ε]为极小值.分析公式(2)可得,当[V(Cx)]与[V(Cy)]的值相等时,[Cx×Cy≈1],说明两个学习者有相当的认知水平;当[V(Cx)]与[V(Cy)]的值为0时,[Cx×Cy]等于0,表示学习者都没有关注到这个知识点,不记录此特征;[V(Cx)]与[V(Cy)]的值差异越大,则叉乘后的值越小,说明两者的相似性越小;反之,则越大.可见,公式(2)能反映出学习者的特征相似性.

3.学习者相似度计算

设任意两个学习者x、y,其对应的用户特征向量空间分别为Vx和Vy,[Cx∈Vx,Cy∈VY],定义向量元素之间的相似性CSsim(cx,cy)为

公式(4)的含义是:学习者之间的相似度是由其特性向量中的概念元素共同决定的.取学习者x特征向量中的任意概念,计算此概率与学习者y特征向量中所有元素的概念相关度和评分值,取最大值;然后对得到的最大值做累和,除以x中特征向量的个数,得到平均值作为学习者x与y的相似度.

五、实验分析

为了验证所提出算法的有效性并进一步改进算法,我们设计了一个具备一般性特征且简化的软件系统虚拟学习社区.实验结果表明,所提出的学习者模型能够有效地表示学习者的个性化特征,所提出的学习者相似度计算方法能够很好地区分出相近的学习伙伴.

1.算法实验步骤描述

(1)建立基于本体的软件系统知识库

咨询领域专家后,建立一个简化的软件系统领域本体,为虚拟学习社区中的学习者和学习资源标注提供统一、标准的知识背景.生成的知识空间结构如图2所示(具体应用中可以构建更加详细的概念关系).将概念树中的结点按照层次遍历的顺序编号,具体编号对应的概念名如表1所示.

(2)本体中的概念相关度

根据公式(1),设置调整因子[α等于0.50],可得到本体中两个概念之间的相关度.计算得到部分概念的相关度,列举如表2所示.

从表2可以看出,概念相关度具有几个特点:①概念自身的相关度为1;②概念之间的相关度是对称的;③当概念之间距离相等时,相关度会随深度的增加而增大.

(3)学习者相似度计算

经过一段时间的学习之后,系统中的学习用户所形成的个性化特征向量记录如表3所示.

从中可以看出,Learner1、Learner2和Learner5差不多都接近0.75,因为他们都感兴趣操作系统和MS-Office;Learner2和Learner8对C#语言的掌握程度相同,出现相似度为1的情况;Learner3和Learner4都爱好程序设计,但因为学习的语言不同,相似值为0.4720;Learner6和Learner7虽然学习的软件不同,但其所学的内容都是图像处理方面的知识,彼此之间的相似值也较高(0.6267);Learner3和Learner7由于学习目标相差较远,计算得出的相似值不高(0.1012).显然,计算得出的相似度较好地反映了虚拟学习社区中学习者之间的相似性,得出的相似值符合真实学习环境中的经验值.2.算法时间复杂度分析

算法的执行可分为两部分:离线执行和实时执行.

由于本体概念树在系统设计时就基本稳定,公式(1)的运算可以离线进行,在实时计算时可以直接读取.

对于实时计算部分,检测定虚拟学习社区中的用户数为n,本体概念树中的概念数为m;分析公式(4),计算某个学习者与其他学习者之间的相似度最坏情况下的时间复杂度为O(n×m×m).仔细分析后不难发现,由于学习者感兴趣的学习主题一般都相对有限,可以认定为常量C,因此,实际运行的算法复杂度一般为O(n×C×C).

[参考文献]

[1]HopeN.Tillman.Virtualmunitybuildingusingintertools[EB/OL].[2004-10-16].http:∥.Hopetillman./i100/vc.

[2]赵建华,李克东.信息技术环境下基于协作学习的教学设计[J].电化教育研究,2000,(4):7-13.

[3]黄怀荣.CSCL的理论与方法[J].电化教育研究,1999,(6):25-30.

[4]张立国.虚拟学习社区交互研究[D].陕西师范大学,2008,(8):22-23.

[5]Tervsky.FeaturesofSimilarity[J].PsychologicalReview,1977,84(4):327-352.

[6]LeacockC,ChodorowM.CombiningLocalContextandWordNetSimilarityforWordSenseIdentification[A].FelbaumCed.WordNet:AnElectronicLexicaldatabase[M].Cambridge,MA:MITPress,1998.265-283.

[7]LinD.AnInformationTheoreticDefinitionofSimilarity[A].ProcoftheInt’lConfonMachineLearning[C].1998.296-304.

[8]高毅,申瑞民,杨帆等.基于开放E-Learning平台的学生行为分析中心[J].计算机工程,2004,30(15):86-87.

[9]谢忠新,王林泉,葛元.智能教学系统中认知型学生模型的建立[J].计算机工程与应用,2005,(3):229-232.

[10]林木辉,张杰,汪星一.一种基于本体的学科知识库构建方法[J].闽江学院学报,2008,(5).

[11]林木辉,张杰,包正委.智能教学系统中基于本体的知识表示及推送研究[J].福建师范大学学报:自然科学版,2009,(1).

[12]Fensenl.Ontologies:silverbulletforknowledgemanagementandelectronicmerce[M].Berlin:Springer--Verlag,2001.

收稿日期:2013-09-15

作者简介:林木辉,福建师范大学教育技术系(350007).

责任编辑石子