论专业信息网站的建立
By  master 发表于 2006-7-29 21:37:00 [出自: 蔺军

【摘要】 如何帮助用户在互联网上方便快捷地查找和利用网络信息资源, 是一个亟待解决的重要课题, 基于这种认识, 促使了专业信息资源站的建立。
碧森尤信 

  Internet 中丰富的、无限增长的信息资源使它已经成为人们获取信息的重要来源之一。但由于 Internet 在管理上的开放性以及Internet 上的信息资源在地理上的分散性和组织上的松散性, 也给人们充分利用网络信息资源带来了一定的困难。信息太多, 对我们有用的太少分布杂乱, 结果导致了信息噪音。如何帮助用户在互联网上方便快捷地查找和利用网络信息资源, 是一个亟待解决的重要课题, 基于这种认识, 人们希望设计出一种搜索工具, 能自动从网上已有的多个搜索引擎库中同时下载我们指定方向的资源, 通过合理的资源组织方式在本地建立可供使用的信息资源站, 即专业信息资源站。那么, 如何构建一个专业性较强、揭示学科较深的网站呢? 笔者认为主要从以下几个方面入手。

一、专业搜索引擎设计与要求

  所谓专业化搜索引擎, 就是专为查询某一学科或主题的信息而产生的查询工具, 对解决实际查询问题要比搜索引擎门户有效得多。如 North carolina 大学计算机科学系和法学院联合开发研制的 LIB- client- IRIS Web 系统, 可以用自然语言对网络上的法律信息进行全文检索, 使得法律工作人员、研究人员、法律专业学生及所 有对法律感兴趣的人获取全面高质量的专业信息的效率大大提高,取得了令人满意的效果。它的搜索器(集中性网络蜘蛛)只搜集特定的主题信息, 按照预先已定义好的专题有选择地收集相关的网页。这样大大降低了收集信息的难度, 提高了信息的质量: 由于它收的学科领域小, 信息量相对较少, 可以用“ 专家分类标引”的方法对收集到的信息进行组织整理, 进一步提高信息的质量, 建立起一个高质量、专业信息收录全、能够实时更新的索引数据库; 由于专业性搜索引擎只涉及某一个或几个领域, 词汇和用语“ 一词(一语)多义”的可能性降低, 而且可以利用专业词表进行规范和控制, 大大提高“ 查全率”和“ 查准率”; 由于是专业化的搜索引擎, 可以聘请专家对用户的检索要求进行网上咨询和网上讲解、提高查询语句的明确性和精度, 使查询结果的“ 准确率”大大提高。利用信息智能代理技术, 使用自动获得的领域模型(如 web 知识, 与用户兴趣相关的信息资源、领域的组织结构)、用户模型(如用户背景、行业、兴趣、风格)的知识进行信息搜集、索引、过滤(包括兴趣过滤和不良信息过滤), 并自动地将用户感兴趣的、对用户有用的信息提交给用户。因为专业搜索引擎本身所具有的许多特点, 使得它能够解决门户搜索引擎无法解决的问题。专业搜索引擎的出现和发展必将会促进搜索引擎技术的进一步发展。

二、指引库的建立

  指引库, 又被称为“ 导航库”、“ 虚拟文库”。指引库是指在其所建立的数据库中, 从物理上讲, 并不存储各种实际的信息资源, 但通过对其访问, 可以检索到有关数据库的实际资源, 指引用户到特定的地址获取所需信息, 把互联网上与某一或某些主题有关的节点进行集中, 按照方便用户检索的原则, 以用户熟悉的语言进行组织, 向用户提供这些资源的分布情况, 它可以弥补互联网本身检索工具的不足, 从被动使用到主动创造, 更适应用户的需求。它对互联网上已存的信息资源给出链接指针, 供读者随时选择利用。

  1.指引库的组成与内容。指引库主要由反映该专业国内外信息资源的 UFL 原始信息和方便信息组织和用户查询的支持技术这三个部分组成, 它们均需要研究相应的技术支持。指引库类似于我们所建立的专题数据库。它们的本质区别在于其内容的不同。指引库中存放的是有关主题或用户所需信息的数据库或服务器的地址等信息。图书馆根据用户的需求情况, 将文献信息量大、价值高的网站收集汇编起来, 建立科学的分类体系和链接, 并对 URL 的主要内容作出简介和评价, 读者在其引导下通过 URL 的绝对地址, 由读者进一步查询, 从而获取文献信息。形象地说, 互联网络是信息的海洋,指引库是航海图。

  2.指引库主要包括的工作。(1)在对本馆用户的需求进行了充分调查调研之后, 根据本馆的实际需要, 确定要建设的指引库的学科主题范围。(2)研究在互联网上这些学科主题信息资源的分布情况、信息含量以及相关度等。(3)制定信息跟踪、采集、分析、评价和套录、分类及建库等采用的技术方案及工作细则。(4)研究开发相应的用户查询软件。(5)指引库的定期更新与维护。

  3.指引库信息资源的搜集。对网上的信息资源的查重、过滤、取舍等等这一系列的工作, 需要图书馆员具备娴熟的专业知识, 去粗取精, 迅速判断出信息的权威性、准确性、价值性, 这是信息内容能否得到质量保证并获得用户青睐的决定因素。

  筛选出来的信息,还要根据各类主题按照一定的逻辑规则重新排列, 排序成新的主题索引, 并对每个网址加注信息内容的简要介绍和评论。为方便不懂英文的用户, 对一些英文摘引可以进行适当的编译, 目的是发挥导向和顾问的作用, 帮助用户迅速了解所需信息内容的核心与要点, 提高信息服务的深度。

三、信息资源库的建立

  信息资源库的建设是整个专题网站内容的核心。它主要通过以下几个方面考虑。

  1.将相关的网页下载分类, 并进行标引。下载分类主要是使用搜索引擎将网站页面的主要内容一一下载, 按照该专业的标准要求进行分类; 标引是根据站点的属性(政府、科研、企业、大学等)、站点的分类、主题以及页面的主题、信息类型、信息表述形式(全文、文摘、索引等)分别用规范的主题词、分类等标识出来。

  2.确定搜集学科范围。为确保信息收录的权威性,针对研究人员对期刊和科研竞争对手信息的需求, 制定了收录 JCR.ISI 所有研究机构为信息源的选择策略。针对本校科研人员及管理人员的需求, 他们要了解世界上最新、最全面的科研信息和科研成果特点, 在选择资源时, 以世界有名的 ISI 公司的两大知名产品 JCR(期刊引文报告, 收录全球 4700 多种期刊)和 ESI(科学引文指标数据库)涉及化学化工研究领域研究机构的网站达 4300 多个。这两个资源库类丰富, 涉及大学、研究机构、数据库、软件、图书馆、期刊等。基本上能够保证资源收集的全面性和广泛性, 满足用户需要的多样性, 满足专业领域内科研人员的信息资源需求。

  3.按照分类进行资源检索, 避免资源分布过度不平衡, 确保各分类资源收集全、准。

  4.为更好地保证信息资源的加工速度和质量, 聘请学科专家和 学科馆员根据其熟悉领域的资源进行收集和筛选。

  5. 确保收录信息的全面性, 同时考虑到信息加工人员外语水平, 资源的收集语种以中英文为主。

  6.通过基于 WEB.FTP 的搜索引擎来收集信息资源。利用专业搜索引擎这种基于人工分类基础上的搜索引擎, 而且在查询上应以用高级检索为主, 以提高所得结果的质量。

  7.通过相同学科的门户网站、大学的院系主页及图书馆主页来进行收集。在这里要注意的是该类型的网站一般都有自己的网络资源搜索引擎或资源列表, 且多为人工收集所得, 因此其信息价值大于通用搜索引擎搜索所得的信息价值, 但在搜索前要注意浏览该搜索引擎的帮助文件,以免漏检。

  8.对于一些特殊的资源类型, 应采用不同的搜索策略。如期刊,这类资源在通用搜索引擎中的资源相当的不足, 甚至某些学科方面还是空白点, 应从一些著名的学术期刊出版公司和大学图书馆的网页中搜索; 再如软件和数据库, 这类数据从通用搜索引擎中查询得到的多为大型数据库或常用软件, 对于一些具有特殊功能和小而实用的数据库主要从一些著名实验室和大学的院系主页中查询和得到。收集这些资源的时候应注意知识版权问题, 以避免以后引起不必要的法律纠纷。

四、建立信息资源评价标准

  信息资源评价标准是检验资源建设所取得的结果和获得质量的程度。它关系到资源的取舍及门户网站所包含资源的质量水平,对于网站的长期运行和服务是至关重要的。

        1.学科及类型属性。即资源是否在生命科学门户所确定的学科覆盖范围和资源类型范围内, 这是判断一项资源是否被收录的先决条件。

        2.内容特征。这是与资源质量最直接相关的因素, 从资源内容是否具备客观性、准确性、权威性、独特性、广度和深度、时效性等条件出发, 对资源的质量进行综合考察和评价。如考虑所选资源与其他同类资源的比较, 网站创建者, 服务对象, 所采用的国家语言, 以及视频、音频等多媒体的使用等因素。

        3.组织形式。资源组织体系是否合理、清晰, 网站容量(信息种类、数量等)是否易于使用, 用户界面是否友好, 响应速度是否快, 是否要用账号和密码登陆, 是否支持良好的浏览与检索功能, 标准和技术是否开放等。

        4.完整性和可靠性。资源得到长期维护和更新支持的可能性, 以及有否管理人员的 E- mail 等联系途径。

在专业信息网站建成后, 大大地提高了检索效率, 同时, 一大批高质量的专业信息被揭示出来, 并及时提供给用户。但是,也存在着一些不足。如某些资源细加工程度不够、一些资源标引所提供的检索路径太少等等, 这些有待于进一步加强。

参考文献:

1.李学军等.因特网上化学化工资源的开发及利用.山东化工[J], 2004( 2) :33

2.张瑜.论国内英语教学专业网站的信息资源建设.[J]教育信息化, 2004( 4)

3.蒙建波, 李良喜.基于 WWW 的专业网站若干原则.自动化仪表[J], 2000.(8) :21    

本站搜索: 专业 信息网站 建立
[在Google上搜索相关文章] [在百度上搜索相关文章]

【郑重声明】 本站所有文章除注有来源网址外均为互联网首发,按照创造共用方式授权,允许相关网站转载,但必须标明作者名称并在明显位置作好原文网址链接(复制以上链接),且不能运用于任何商业目的。
——建筑知识引擎小组 创造共用方式
 
阅读全文 | 回复(0) | 引用通告 | 编辑

本站已经关闭回复功能,如需联系本站,请发送email至CKETeam[at]gmail.com(请将email地址中的[at]改为@)。

发表评论:

    昵称:
    密码: (游客无须输入密码)
    主页:
    标题:
    数据载入中...

 
 站长公告

  碧森尤信,聚集最优秀的建筑网络资源,中文建筑知识引擎的发起者和推动者!
  本博客作为碧森尤信网站用户的官方在线服务通道;同时也作为站长交流和学习空间。

联系站长
pipcn.com[at]gmail.com

联系[建筑知识引擎小组]
CKETeam AT Gmail.com

站点日历
<< < 2006 - 7 > >>
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31
最新日志
最新评论
最新留言
 站长链接

深圳科技园
站点统计
日志搜索
用户登陆

 
© 2005-2006 碧森尤信.