改进的页面与时间阈值的会话识别法

原文链接:万方

  • 作者:

    郑立山,滕少华

  • 摘要:

    会话识别是Web日志挖掘的基础,提高会话的识别率能为后续模式的挖掘提供准确可靠的数据,已有许多研究集中于此.在常用的计算时间阈值识别方法的基础上,提出一种改进的基于URL页面类型、页面信息量和停留时间的平均阈值识别方法.针对不同的URL页面类型采用不同的阈值计算方法,并设置时间阈值.相对于已有的对所有用户访问页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.

  • 关键词:

    Web日志挖掘 数据预处理 用户会话识别 动态阈值

  • 作者单位:

    广东工业大学计算机学院

  • 基金项目:

    广东省自然科学基金项目(06021484,9151009001000007)

  • 来源期刊:

    计算机应用与软件

  • 年,卷(期):

    2012010

相似文献