[面向个性化检索系统的用户兴趣模型的建立] 第四代搜索引擎的特点是个性化检索

摘 要用户兴趣特征采集是构建性化系统项关键技术。

用户特征兴趣模型进行了研究,提出了基直接学习反馈学习和历史学习混合学习方法,以及用户兴趣特征权值算法,并对用户兴趣特征提取流程进行了说明。

关键词性化;检系统;用户兴趣模型

引言。

用户兴趣特征是实现性化检关键。

当前,检系统性化问题并没有得到,不人使用相检词得到检结是相。

其主要原因就是没有对用户使用检工具,记录用户行,及用户兴趣

因,识别用户检程行及特征,记录、学习并且维持用户偏,及了用户信息更新状况,并实现用户管理和主动推送等都给检工具提供了更高要,建立用户兴趣特征模型可以很这些问题。

用户特征兴趣模型

建立利用客户端浏览器用户兴趣选择和用户对检结反馈信息,推理用户信息兴趣取向性化模型

用户首次使用,通册系统性化信息输入系统,从而形成用户特征化数据库。

并将这些信息提交给系统,以便系统使用。

其设计目标是开发能够检性化信息,针对不用户提供不检结,具有定智能性性化引擎。

系统应该具有以下功能。

()采集各类络信息;。

()系统应保留每用户信息,并允许用户对己信息进行定制;。

(3)用户使用系统,系统用户行进行记录,并逐渐形成每用户用户模型;。

()用户检,根据信息用户模型,给用户提供相关更高信息;。

(5)系统界面友,易使用,能够运行不平台上。

用户兴趣特征学习

用户兴趣学习是指根据用户对浏览信息选择及使用用户反馈信息,采取学习方法逐步明确用户兴趣程,实质上是机器学习程,可以采取多种机器学习方法实现它,主要有直接学习反馈学习、历史学习和观察学习四种方法。

系统采用了基直接学习反馈学习和历史学习混合学习方法。

该方法允许用户直接对用户兴趣模型进行修改,并通用户对检结反馈见进行学习,对结输出形式、相关排列顺序及结记录输出,用户可以加以评价。

用户兴趣模型通这些反馈信息,不断进行学习,可以提高检准确性。

可以通分析用户历史使用纪录,段积累,就可以发现用户若干潜规律,这些规律通常是用户没有识到。

通这种学习,可以用户发现己潜,激发用户检动机,往往可以起到启发性作用。

用户兴趣提取流程。

建立用户兴趣特征信息检程作用有()用户兴趣管理用户兴趣特征用户兴趣进行描述,用户兴趣般包括了身信息、关信息等,根据知识相近和相关属性,可以用户兴趣进行扩展。

用户可以通正面直接建立和修改管理用户兴趣特征,也可以用户代理器“黑箱”暗操作。

()用户信息管理管理用户背景信息,如所关心信息领域、年龄层次、系信息信息,询些跨领域信息提问,考虑用户背景信息,有助更加对口地提供用户真正关心信息

用户兴趣特征系统流程图如图所示。

生成用户特征兴趣模型,用户系统进行交,根据交容构成兴趣树,从兴趣树根节往下,提供给用户选择兴趣就越具体。

兴趣树根节通往叶节程是发现用户兴趣,用户性化信息提取程就是从兴趣树出棵用户兴趣子树程。

3 用户兴趣特征权值算法。

用户兴趣代理

代理是指系统持续主发挥作用计算实体(络制造代理器),代理具有独立性,主性和交性等特性,用户兴趣特征用户性化都是通代理完成,代理主要责()性化兴趣特征建立、获取及设置。

性化兴趣特征建立是用户代理交程。

用户初次使用性化系统,要输入用户信息,包括用户名称,姓名,年龄,邮箱地,密码等,然根据用户兴趣树选择兴趣子树,根据用户特征兴趣生成算法生成性兴趣特征,保存代理器;,用户可以对性兴趣特征进行修改或重新设置。

()对结滤。

引擎将检到结返回到代理,先通代理性化兴趣特征信息进行滤,然将处理结返回给用户浏览器。

利用兴趣特征滤结,用户使用引擎,首先输入关键词,击输入关键词与用户兴趣特征将作关键词,由引擎将检出对应结返回到用户浏览器,用户兴趣特征起到了滤作用。

3系统工作流程。

首先,用户进入r xlrr,击进入检页面,用户首次使用册新用户,用户输入基人信息进行兴趣选择,系统会根据选择生成用户兴趣子树,生成人兴趣特征,生成人兴趣特征将通代理器保存用户兴趣特征数据库。

用户登陆,首先输入用户名和验证密码,进入系统,系统提取用户性化兴趣特征,当用户输入想关键词,用户信息,当用户对结不满,或者对用户兴趣特征要修改,可以通击用户兴趣修改进入用户兴趣修改页面。

结束语。

详细论述了用户兴趣特征获取方式,随论述了用户兴趣特征权值算法以及建立用户兴趣特征模型程,用户可以信息反馈修改用户兴趣特征,研究容将有助性化系统发展。

参考献。

[]李广建性化信息系统研究与实现[]博士毕业论国科学院研究生院(献情报心),0085。

[] R,r,Gvrg rg klg r lg b g lgr [] l g, 008() ~37。

[3]徐宝引擎与信息获取技术[]北京清华学出版社,008。

[] Grr,r,glrgzg r rrl klg vr rrk g R rl rk [], rl rk 007,8(3)87~95

0 次访问