-
数据集浓缩研究综述
数据集浓缩是在一定条件下去除数据集合中的噪声和冗余数据,选用一个充分小的数据子集来代替原有数据集,而不降低数据挖掘任务的精确度的过程,是数据挖掘任务得到良好效果的保障,在某些场合又可作为完成数据挖掘任务的主要方法.对数据集浓缩技术的发展状况进行总揽和评述,分析并展望未来发展方向,为将致力于此研究方向的科研人员提供参考.顾静秋,吴华瑞,朱华吉 - 计算机应用与软件文章来源: 万方数据 -
一种基于多阅读器数据冗余的高效RFID数据清洗策略
随着RFID技术的发展,RFID的应用越来越广泛.然而,由于RFID硬件设备固有的限制和环境噪声的影响,造成了RFID原始数据的不确定性,使RFID在很多领域中的应用受到限制.现实应用中的部署环境通常由多个阅读器及大量标签组成,而现有的数据清洗算法大多只针对单个阅读器对标签的读取情况进行研究,因此在真实应用中的效果差强人意.本文综合考虑RFID的数据特性、阅读器和部署环境的先验知识以及具体应用中的约束条件三个方面,提出一种更贴近现实应用的基于多阅读器数据冗余的数据清洗策略LC-INFER(Location-Containment Inference):首先基于贝叶斯推理对数据进行初步清洗,其次结合基于物体间包含关系的平滑技术,并考虑约束条件对数据进行二次清洗以提高数据的准确性,最后部署真实供应链应用环境进行实际测试,并用大量仿真数据集进行模拟测试,验证了本文提出的RFID数据清洗算法的准确性及高效性.马茜,谷峪,张天成,于戈 - 小型微型计算机系统文章来源: 万方数据 -
RFID系统数据处理方案研究
读写器与标签通信过程中产生大量冗余数据,将对RFID系统通信构成较大负荷,降低了系统效率.在此研究了一种可灵活配置的RFID系统数据处理方案,该方案基于嵌入式数据库技术,在读写器平台上根据不同的系统配置,实现了不同的数据处理过程.实测证明,采用该方案的RFID系统,输出的冗余数据明显减少,有效降低了系统的通信负荷,提升了读写器的智能性及系统效率,在实际工程应用中取得了良好效果.梁坤 - 现代电子技术文章来源: 万方数据 -
Cumulus:一个基于网络编码的分布式文件系统
基于网络编码在并发式数据传输时能够有效地降低网络负载的优越性,应用网络编码优化分布式文件系统的容错问题得到了广泛的关注.为了研究网络编码在分布式文件系统中的应用及其在降低网络负载的有效性,文中基于开源的Hadoop项目设计并实现了面向网络编码的分布式文件系统.该系统通过对存储文件进行切分,然后将这些文件切片进行编码存储,能够以更小的冗余开销获得更好的容错性能,同时,能够利用网络编码的性能提高网络资源利用率.陈运海,陈正亮,王钦辉,叶保留 - 微电子学与计算机文章来源: 万方数据

