-
基于虚词切分的藏文分词系统的设计与实现
藏文分词是藏文自然语言处理的基础.根据藏文虚词在藏文文本中的特殊作用以及虚词的兼类性、结合性、黏着变体性和还原特性,设计实现了一个基于藏语虚词切分的正向最大匹配的藏文分词系统,该系统对原始文本进行逐次扫描处理得到分词结果.实验表明,文章提出的藏文分词系统具有较高的切分精度和切分速度.赵栋材 - 西藏大学学报(自然科学版)文章来源: 万方数据 -
基于Nutch的物流信息平台网页资源定向采集系统
针对物流信息平台中信息资源采集系统建设的不足,提出建立基于Nutch的网页资源定向采集系统,并对中文分词、主题相关度分析、结果排序、正文解析等关键模块进行重点探讨.最后在一定条件下进行了实验,并分析了实验结果.刘兴邦,赵晓娇 - 物流技术文章来源: 万方数据

