-
数据集浓缩研究综述
数据集浓缩是在一定条件下去除数据集合中的噪声和冗余数据,选用一个充分小的数据子集来代替原有数据集,而不降低数据挖掘任务的精确度的过程,是数据挖掘任务得到良好效果的保障,在某些场合又可作为完成数据挖掘任务的主要方法.对数据集浓缩技术的发展状况进行总揽和评述,分析并展望未来发展方向,为将致力于此研究方向的科研人员提供参考.顾静秋,吴华瑞,朱华吉 - 计算机应用与软件文章来源: 万方数据 -
基于元挖掘的数据归约工作流优化
传统的数据归约工作流是依靠领域专家进行选择而产生的,这种选择工作流的方法虽然可靠性高,但效率很低.针对这种情况,提出1种基于元挖掘的工作流优化方法.利用元挖掘的思想进行数据归约实验,产生元数据,用户可依据元数据进行数据归约工作,得到基于数据集特征的工作流优化选择规则.实验结果表明,该方法能够自动给用户推荐恰当的、适用性强的数据归约工作流,满足用户的期望并且提高数据归约任务的执行效能.冯蕴天,张宏军,郝文宁 - 系统仿真学报文章来源: 万方数据 -
一种基于文本特征提取的版权保护方法
互联网上,文本非法复制和盗版现象日益严重,因此迫切需要有效的文本版权保护方案.借助于特征提取方法和文本分类技术,针对具有版权争议的文字作品,提出了一种基于文本特征提取的作者识别方法.实验结果表明,提出的算法能够区别出不同作者的文字作品,能有效地把一个具有争议的文字作品进行分类,并识别出作者.因此该方法可以辅助解决争议作品(特别是著名作者的争议作品)的版权纠纷,打击盗版,维护诚信.雷军程,黄同成,柳小文 - 计算机科学文章来源: 万方数据 -
改进的SPRINT算法及其在体质数据分析中的应用
为了能够利用常规测试数据快速准确地确定人体体质状况,引入了纯区间的概念,并提出了一种趋势选择方法,在此基础上提出基于趋势选择的SPRINT算法(TESTSPRINT).利用该算法可以根据身高、体重、握力等基本测试数据快速建立人体体质状况决策树,为快速确定人体体质健康状况提供依据.实验和理论分析结果均表明,提出的TESTSPRINT算法可以有效为分析人体体质健康状况提供决策依据,具有较高的准确性,并且时间和空间开销较原SPRINT算法小.丁亚芝,郑志高,马嵘 - 体育科学文章来源: 万方数据 -
基于单元格和属性权重的离群点检测
离群点检测是数据挖掘领域的一个重要的研究方向.针对高维数据空间中离群数据的挖掘速度和准确度的问题,提出一种基于单元格的离群点检测算法.该算法在高维数据空间中对数据进行降维,并且将数据依据属性权重划分成若干空间单元,从而减少查询次数,提高离群数据的挖掘速度.另外,通过对属性的加权处理能够更有效地突出属性的特殊性,从而提高挖掘的准确度.理论分析和实验结果表明了该方法是有效可行的.姜立明,柴瑞敏 - 计算机应用与软件文章来源: 万方数据 -
关联规则在远程教育教学评价中的应用
由于影响远程教育的因素非常复杂,因此教学评价一直是远程教育发展过程中值得探索和研究的问题.本文利用数据挖掘技术,将关联规则应用于远程教育的教学评价中,探讨教学质量和效果与某些因素的相关性,从而为教学部门提供决策支持信息,改善教学工作,提高教学质量.肖志明 - 中国远程教育文章来源: 万方数据 -
数据挖掘在英语语言学话题跟踪评价体系中的应用
本文主要针对英语语言学评价体系的特点,在系统功能语言学理论框架下,运用基于粗糙集的数据挖掘技术,对英语语篇中的评价资源进行跟踪分析,并通过实例验证了该方法的可行性和有效性,解决了英语语言学话题跟踪评价体系的一些关键问题.王雪,张伟,杨昕宇,李树平 - 微计算机信息文章来源: 万方数据 -
基于大数据的多变量系统建模方法研究
提出了一种新的基于大数据的多入多出系统建模方法.该方法将机理建模、实验建模、智能建模等方法有机结合,通过仿真模型的阶跃实验确定了模型结构和各参数初始范围,挖掘现场运行的历史数据,利用智能优化算法对模型进行校正,得到系统的传递函数模型.解决了不允许或者没有条件在生产现场施加大范围频繁的阶跃扰动实验的问题,确定了模型初始结构,克服了多变量智能寻优时初始值范围不确定的困难.这一新辨识思想成功应用于超超临界机组协调控制系统传递函数辨识,该系统以给水量、给煤量和高调门开度为输入,机组功率、主汽压力和中间点温度为输出,辨识得到了满负荷工况附近的传递函数模型,为协调控制器的设计与优化奠定了基础.袁世通,韩璞,孙明 - 系统仿真学报文章来源: 万方数据 -
改进的页面与时间阈值的会话识别法
会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此.在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法.针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值.相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.郑立山,滕少华 - 计算机应用与软件文章来源: 万方数据 -
知识型旅游目的地管理平台框架及其构建
旅游目的地的竞争力很大程度上依赖于信息如何通过基于ICT的基础设施和服务来满足相关利益方的需求.但是,在目前旅游目的地已积累了大量可用数据的情况下,这些有价值的知识却没有被很好的利用.旅游目的地的管理竞争力和组织学习可以应用商务智能的方法得到显著地提高.本文在总结国外文献与案例的基础上,提出知识型目的地管理平台的一般框架,并基于此框架,引入商务智能方法,构建了一个基于数据仓库的旅游市场决策支持平台,以期能够服务于旅游目的地的管理者的决策制定与专家学者的相关研究.乔向杰,张凌云 - 人文地理文章来源: 万方数据

