就爱论文|会计论文|管理论文|计算机论文|医药学论文|经济学论文|法学论文|社会学论文|文学论文|教育论文|理科论文|工科论文|艺术论文|哲学论文|文化论文|外语论文|格式论文
就爱论文
计算机应用论文  计算机理论论文  计算机网络论文  电子商务论文  软件工程论文  操作系统论文  通信技术论文   
浅析一种基于前缀节点的频繁子图挖掘算法

摘 要:基于频繁子树挖掘算法中的前缀节点思想,将模式图分为图核—分支—连接向量三个部分,提出了be算法。对在分支上扩展得到的候选模式图,be算法能够在常数时间内完成规范化判定。通过实验证明be算法的子图挖掘效率有显著提高。
  关键词:数据挖掘;频繁子图;同构类;规范化形式;前缀节点
    
  frequent subgraphs ining algrith based n prefix nde
  
  li hai-b,ang yuan-zhen
  (researh institute f database ≈ ultiedia, shl f puter siene ≈ tehnlgy, huazhng university f siene ≈ tehnlgy, uhan 430074, hina)
  abstrat:based n the prefix nde ethd in frequent tree ining algriths, adpting re-brahes-nneting vetr partitin n graphs, this paper prvided a ne algrith be. the be algrith uld aplish annial deterining in nstant tie n andidate pattern graphs expanded fr branhes. perfrane testing prves that the effiieny f subgraphs ining is iprved by be algrith.
  key rds:data ining; frequent subgraph; isrphis lass; annial fr; prefix nde
  在化学信息学、生物信息学、网络结构分析等领域,频繁子图挖掘算法是一个热点研究问题。与其他的频繁模式挖掘算法类似,一般的频繁子图挖掘算法都分为候选模式生成和模式频繁判定两步[1]。在频繁子图的挖掘过程中,会生成大量的候选模式图。对每一个新产生的候选模式图,在进行频繁判定之前,都要首先判断它与前面产生的模式图是否同构。而图的同构判定是一个复杂度介于p与np之间的问题[2~5]。受此限制,目前出现的子图挖掘算法的效率还不是很高,特别是与频繁子树挖掘算法相比。频繁子树的挖掘也会生成大量的候选模式树,但基于一种称为前缀节点的方法,可以在常数时间内解决候选模式树的同构判定问题。
  本文针对这种情况,基于频繁子树挖掘算法中的前缀节点思想,提出了一种在部分候选模式图上能够在常数时间内完成同构判定的方法,并以此方法为核心给出了一种新的高效频繁子图挖掘算法——图核—分支扩展算法(be)。
  1 基于次前缀节点的频繁子树挖掘算法
  频繁子树挖掘算法分为候选模式子树生成和子树频繁判定两步。候选模式子树可以通过在一棵频繁子树的任一个节点上扩展任一条边得到,但这种扩展会产生大量同构的模式子树。一种朴素的筛选方法是检查新生成的模式子树是否与先前生成的某棵模式子树同构。若存在同构的模式子树,则当前扩展是无效的;否则当前扩展生成一棵新的有效的模式子树。因此,候选子树的生成,本质是要遍历所有的子树同构类。对每一类同构的子树,只需生成一棵代表子树即可。这棵代表子树也成为该同构类的规范形式。同构类的规范形式有多种不同的定义方法,在子树挖掘算法中,通常的做法是[6]:
  在一棵树t中,用深度元组t=(d,le,lv)表示一条边e。其中:d为e的终点v的深度;le为e的标记;lv为v的标记。在深度元组间可定义偏序<t:当且仅当d1>d2,或d1=d2且le1未完...点击下方链接下载完整文档

浅析一种基于前缀节点的频繁子图挖掘算法

摘 要:基于频繁子树挖掘算法中的前缀节点思想,将模式图分为图核—分支—连接向量三个部分,提出了be算法。对在分支上扩展得到的候选模式图,be算法能够在常数时间内完成规范化判定。通过实验证明be算法的子图挖掘效率有显著提高。 关键词:数据挖掘;频繁子图;同
  • 上一篇:浅析移位寄存器的Multisim仿真
  • 下一篇:浅谈基于Simulink的自动控制系统性能的分析与仿真
  • 加强基层国库业务系统应急机制建
    电子报刊版面设计浅谈
    基于LabVIEW可视化数据采集处理
    基于PDM技术的AGC电路设计
    基于条码技术的库存管理系统设计
    计算机病毒及防范措施
    基于Delphi开发平台的分布
    高速公路机电设备管理系统的研究
    运用PowerShell计算行×列表χ2
    基于SOA的实验教学管理原型系统
    关于任务驱动式教学方式在计算机
    基于多智能体的用户偏好系统研究
    关于电子技术应用专业课改的设想
    计算机在儿童保健系统管理中的作
    煤矿无人工作面中视频监控系统的
    浅谈基于ARM7处理器LPC2119的U
    基于数学形态学的心电信号R波
    浅谈基于GIS的通信指挥网上训
    浅析基于IWT和FCM的曲线矢量数
    浅析中小型园区网的设计与实现
    略论一种基于负载均衡异构分布
    浅谈基于Simulink的自动控制系
    浅析移位寄存器的Multisim仿真
    略一种基于混沌搜索的文化算法
    一种提高DSP的ADC精度的方法
    | 设为首页 | 加入收藏 | 联系我们 | 论文发表

    Copyright 2006-2020 © 就爱论文 All rights reserved 本站所有内容均由SPider自动索引,如有侵权请联系QQ:2486851删除