原文链接:万方
王华珍,彭淑娟,缑锦,陈锻生
中医诊疗研究引入机器学习方法存在交互性差和特征值离散性两大缺陷.引入基于随机森林(Random Forest,RF)的可视化技术,对原始数据进行基于RF的特征变换,使样本在新特征空间的类可分性增强;采用主坐标分析法对变换后的数据进行降维,将高维数据的关系信息变换到适合人类视觉认知的低维空间里;在低维空间里采用散点图和平行坐标图对数据进行可视化.在中医慢性胃炎数据集上的实验结果表明,通过RF处理后,各类数据聚集在不同的区域空间中,呈现良好的可分性.这些图形图像视觉信息能帮助用户准确理解数据集的分布规律以及隐含的发展趋势,进而深入探讨这些信息蕴含的中医学意义.
华侨大学计算机科学与技术学院
国家自然科学基金项目(61202298)%福建省自然科学基金(2012J01274)%华侨大学高层次人才科研项目(09BS515)%厦门市科技计划项目(3502Z20123032)
系统仿真学报
2014011