试论期刊的个性搜索设计与实现

摘 要:期刊对文化、科技、知识传播有着重要意义,文化是期刊的内涵,期刊是文化的载体。

在网络高度普及的今天,期刊发挥着巨大的文化影响力。

期刊具有文化导向功能、教育功能、信息功能、娱乐功能。

网络的高度普及期刊带来了更多的客户,但同时也带来了竞争。

虽然我国情期刊市场秩序十分混乱,存在许多问题有好有坏,但实际上依然存在着巨大的竞争压力,据统计我国期刊数量达到八千多种。

个性搜索设计是增强期刊竞争力,提升影响力和利用率的重要手段。

本文将针对期刊个性搜索设计与实现展开分析讨论。

毕业论文网 /2/view—12001565.htm  关键词期刊个性搜索;设计与实现   二十一世纪是一个网络的时代,人们对网络搜索引擎的应用十分普遍,但现如今传统搜索引擎已经难以满足人们的个性化需求。

通过对传统网络搜索引擎的调查发现,传统网络搜索引擎提供的检索服务,不同用户在不同时期搜索到的结果几乎一致,设计上并没有考虑到用户需求变化,缺少个性设计。

虽然国内对个性搜索设计研究的很多,但却极少涉及期刊个性搜索

但实际上期刊更需要个性搜索,因为期刊往往信息量大,刊数众多,并且每一个客户的需求和侧重点都有着很大差异,传统搜索很难满足用户需求。

所以想要使用户能够快速搜索到自己想要的信息,必须将个性搜索融入期刊中。

1 期刊的起源及发展   期刊是随着网络的广泛和普及发展起来的,我国期刊起步于二十世纪八十年年代,一九九五年清华同方开始大规模出版期刊,经过不断的发展一九九八年我国已经发展到了三千五百多种专业特色期刊[1]。

万方是我国一百二十种同步介入网络的期刊,是我国第一个网络期刊,一九九九年我国网上期刊已经达到一千多种。

这个阶段期刊形式和内容上都比较简单,完全可以理解为传统纸质期刊的电子版,这个时期多采用扫描的方式,以扫描纸质期刊为主,使用中并没有经过任何加工和处理,这个时期的期刊商家主要有中国知网、万方、维普、龙源等等[2]。

经过不断的发展和演变,二零零四年期刊开始发生革命性的变化,不论是在传播技术上,还是表现形式上都有了质的飞跃,大量多媒体技术开始融入期刊中,期刊的交互性、可读性大幅度增加,实现了大量同步传播。

期刊类型、种类、内容、形式也越来越多,为读者提供了更多的选择,但这也增加了读者索引到自己想要信息的难度。

虽然后期搜索引擎的出现大大提高了期刊检索速度,但效果依然不理想,个性搜索融入期刊势在必行。

2 期刊个性搜索设计   Lucene是基于当前JAVA最流行的全文检索工具包,Lucene是纯java实现

这个工具包具有一定的特殊性,实际上它并非一个完整的全文搜索引擎,而是一个经过编写的全文检索引擎框架,它主要所能提供的是查询引擎、索引引擎、存储管理以及文本的对接[3]。

虽然它并不是完整的全文搜索引擎,但它可以根据不同的需要镶入不同的需要,来实现全文搜索功能,并且他还能够提供部分文本分析引擎,这便大大提升了检索效率。

此工具包开发发出简单易操作,在设计中可以利用全文检索和部分检索功能实现完善检索

完全可以用于个性搜索设计,想要实现个性搜索,应通过用户兴趣模型来实现

用户兴趣模型包括:初始兴趣模块用户兴趣模块

初始兴趣模块可具备采集功能,不断采集和观察用户兴趣、行为。

然后将观察结果和采集结果用于更新用户兴趣模型。

用户类型可分为普通用户和作者用户

如果用户登陆时,权限属于作者用户期刊中含有该作者论文,那么作者论文内容必然可以反映用户兴趣,在搜索时便可相应反映作者感兴趣的内容。

如果普通用户初次使用系统,则自动获取初始兴趣模型,在客户端上用户可自己进行兴趣选择,系统便可为用户显示感兴趣的内容,如果所显示内容被用户采纳那么关键词便存入用户兴趣模型中。

用户兴趣模型的不断更新,使得搜索精准率越来越高,效果越来越好,从真正意义上实现个性搜索

此外,个性化排序模块也是个性搜索中必不可少的关键。

个性化排序模块通过对用户兴趣模块数据调用,并个性化排序用户使用搜索引擎查询时便会得以展现。

用户兴趣库中已经存储了用户搜索过的关键词,那么个性化排序时便会优先显示与其相对应兴趣度较高的相关内容,排序时根据用户兴趣度大小方式进行排序

在设定检索条件时利用聚类概率结果的方式,取前三个概率分布主题,以保障关键词期刊主题关键词上有一定的概率分布。

个性化排序模块运行时,用户发送相应关键词查询请求,Query调用query request,发送查询请求,Usermodel接收请求后,便会自动获取到用户兴趣库中的关键词并分析兴趣度。

Index在获取到用户兴趣关键词后调用execute query进行检索检索后结合personalsort模块实现个性化排序,将排序结构返回给用户

3 期刊个性搜索实现   索引模块实现,首先要初始化index Writer,当建立建立索引模块时,可以利用index Writer来写索引文件,INDEX_DIR是索引文件存放位置。

在index Writer创建后,可利用Analyzer来进行文文档词法分析和语言处理。

在处理和分析完毕后便通过DocumentProducer来解析处理结果。

结果分析后,建立索引封装成Field,最后再通过index Writer来调用函数实现索引文件,完成整个索引的建立。

索引模块应由关键字记录、关键字属性、组合记录、关键词预存等组成。

用户兴趣模型的实现,可利用添加聚类结果表paper来进行用户权限的运算,利用LDA来提高关键词,利用记录用户浏览历史来更新用户兴趣模型。

个性化排序模式的实现十分关键,因为用户兴趣模块实现需要建立在个性化排序模块的基础之上才能得意实现

个性化排序模块先要设定搜索条件,根据用户提交的搜索条件,调用搜索机制及各类模块,通过各个模块的相互结合实现返回初始化检索结果。

而后利用用户兴趣模块用户兴趣度大小排序,用personalsort来调用排序结果,依次取出用户兴趣度相关的关键词

接收返回的关键信息后,按聚类概率分布的方式进行判断。

并根据相似度计算公式,计算每一个返回结果的相似度,AI判断相似度后,以用户兴趣度的大小进行内容相似度判断,得出搜索结果后,排序时按照兴趣大小、相似度大小排序检索结果,最终把整个个性化排序节结果展现给用户

结果显示后,用户兴趣库便进行自动记录采集,更新入用户兴趣库中。

个性化排序模块利用Index Searcher创建事例化对象,然后通过该对象访问索引目录,利用Term保存检索关键词,通过Query建立查询器,利用HITS返回查询结果。

个性化排序模块应包括:相关度大小排序、连接地址排序关键词排序、摘要检索、结果排序关键词检索、作者检索等。

4 结束语   期刊个性搜索是未来期刊发展的必然方向,随着期刊用户量和信息量的增多,传统搜索很难满足用户需求,不仅搜索效率低,并且准确度也比较低。

用户需要的是更方便,更快捷的搜索服务,个性搜索融入期刊势在必行,对期刊发展有着重要意义。

参考文献   [1]王佳玉.浅析个性搜索设计在网络书籍搜索中的应用[J].湖北现代职业技术学院,2012,13(11):119—124.   [2]汪苏泷.网络期刊的发展及其评价研究[J].浙江电子商务学院,2011,11(14):132—135.   [3]王先谦.信息化时代期刊个性化的重新定位[J].宁波信息工程学院,2013,12(13):112—123.   [4]全欧冠.新时代背景下期刊个性化设计与实现的思路[J].海南信息工程学院,2012,21(13):202—211.

5 次访问