基于数据挖掘的数字档案信息管理研究浅析_档案管理

基于数据挖掘的数字档案信息管理研究浅析

编辑：

2013-12-03

　二、数据挖掘在建设现代化高校档案馆中的应用
　　1、资源类数据包括馆藏档案经过数字化加工而产生的各类电子档案、电子文件中心中存储的各类电子档案、档案软件收集的信息、档案信息网建设和维护信息。我们从研究大学档案用户的信息需求出发，数据挖掘为大学档案馆全面掌握和准确理解档案用户的信息需求提供了方法。
　　(1) 利用Web访问信息挖掘技术发现其中的关联模式、序列模式和Web访问趋势等，构建多维视图的用户兴趣模型。从而可以确定档案信息或服务受欢迎的程度，发现用户访问模式和用户需求的趋势，从不同侧面来研究用户的信息需求，为优化档案馆的档案信息资源建设提供了科学依据。
　　(2) 收集大学档案网web服务器保留的用户注册信息、访问记录，以及有关用户与系统交互的信息等原始数据，经过清洗、浓缩和转换形成便于统计分析的用户查阅数据库、日志数据库、用户定制信息库、用户反馈信息等各种数据集合。

　　2、从建设大学档案馆馆藏信息资源出发，数据挖掘为大学档案馆提供了选择一条科学发展道路的重要依据。
　　(1) 利用档案网和档案管理软件访问信息的挖掘分析出档案资源的利用率，将利用率高、需求量大的传统载体档案优先数字化。例如：通过对档案信息的访问记录、检索请求中用户请求失败的数据进行分析，按类统计档案拒用集和频繁利用集，结合聚集算法发现馆藏资源的缺漏，有针对性地补充和丰富档案信息资源。
　　(2) 在大学档案馆藏管理过程中利用文本挖掘，运用关联、分类、聚类等方法，从海量档案信息中按照相关专题进行挖掘、分类、加工、整理和有序化重组，构建特色档案信息库及各类专题档案信息库等。
　　3、从做好大学档案馆信息管理工作的角度出发，数据挖掘为优化馆藏信息和对未来工作的预测发挥重要作用。
　　(1) 在提供利用环节中，对用户每次借阅的信息进行关联分析，发现各类档案信息之间的关联规则或比例关系，这样可以进一步优化馆藏信息。
　　(2) 开展大学档案馆馆藏信息文本特征的建立、特征提取、特征匹配、特征集缩减和模型评价工作，实现对大量文档集合的内容进行总结、分类、聚类、关联分析、分布分析，通过归纳与总结，发现的知识可以为未来档案工作的趋势进行预测。

标签：档案管理

免责声明

精品学习网(51edu.com)在建设过程中引用了互联网上的一些信息资源并对有明确来源的信息注明了出处，版权归原作者及原网站所有，如果您对本站信息资源版权的归属问题存有异议，请您致信qinquan#51edu.com(将#换成@)，我们会立即做出答复并及时解决。如果您认为本站有侵犯您权益的行为，请通知我们，我们一定根据实际情况及时处理。