一、数据挖掘与知识发现(DMKD)及其应用的研究(论文文献综述)
赵其朋[1](2010)在《基于数据挖掘的短信业务研究》文中研究表明数据挖掘是一种从大量数据中发现知识的方法,它综合了数据库、人工智能、数理统计、可视化等多种技术使用一定算法找出数据中潜在规律,分析产品特点和用户行为特征,为企业运营管理提供决策依据。已经在多个领域获得了广泛应用。本文讨论了数据挖掘的功能特点,数据挖掘的流程和软件工具,以及关联规则、决策树、聚类、神经网络等几种算法。针对某电信公司短信业务实际情况,为分析短信业务特点、减少用户投诉和提升业务量,分别使用聚类、关联规则、决策树、时间序列方法进行了数据挖掘,得到结论并给出了业务运营建议:通过用户分群和业务关联关系制定营销策略、对SP业务加强管控以提升服务质量、引导小灵通离网用户转入C网等。希望对短信业务发展提供有益的参考。
廖赛恩[2](2010)在《养生方数据挖掘分析系统的研制》文中研究指明目的实现养生方剂组成预处理算法(专门针对方剂数据的文本处理算法);建成养生方数据挖掘算法集成系统;开发方剂数据维护系统,提高分析系统的可维护性,最终实现易用、实用的方剂数据挖掘分析系统。方法运用关联规则算法进行数据挖掘分析;使用正则表达式为基础的文本处理技术进行方剂数据预处理;采用软件工程思想完成该系统。结果对方剂数据预处理的初步预处理与中药名称映射均得到可以接受的结果;对养生方数据挖掘分析得到的结果与传统理论吻合度较高。结论该平台实现了一个方剂数据挖掘从预处理到得出最终结果的标准流程,且易于使用、有效、高效。
马黎,王颖[3](2009)在《空间数据挖掘和知识发现的研究》文中提出随着现代科技和传感器的发展和应用,复杂多变的空间数据日益膨胀,远远超出了人的解译能力,迫切需要数据挖掘和知识发现为其提供知识。研究了空间数据挖掘和知识发现的概述,可发现的空间的关联、特征、分类和聚类等知识,以及它与相关学科的关系,分析和展望了SDMKD的应用开发。
陈卓民[4](2009)在《数据挖掘技术在国内外的研究和发展现状》文中研究表明数据挖掘是一门交叉学科,数据挖掘技术是目前国际上数据库、数据仓库和信息决策系统领域最前沿的研究方向之一,引起了国内外众多领域科学家和工商界的广泛关注。本文阐述了数据挖掘的定义和特点,并分析了数据挖掘技术在国内外的研究和发展现状,以及应用情况。
柳亮亮[5](2009)在《数据挖掘在煤矿安全预测预警中的应用研究》文中研究说明信息化是当今世界经济和社会发展的大趋势。随着煤矿生产系统信息化、集成化程度的提高,对矿山多源异构数据信息的分析研究已成为矿山生产、研究部门共同关注的问题。面对煤矿信息系统所产生的海量数据,运用数据挖掘技术,对这些数据进行分析、推断,以做出预测,对加强煤矿安全生产、促进煤炭行业现代化建设、提高煤矿的经济效益和社会效益具有重要的现实意义。本文基于数据仓库和数据挖掘等先进技术,结合目前流行的煤矿信息管理系统结构和数据流程,建立起了煤矿监控系统的总体框架和监控数据仓库系统框架结构。然后在此基础上分析了监控数据仓库体系结构的设计,利用关联规则算法中经典的Apriori算法,在煤矿监控系统数据中进行简单尝试性的应用研究,发现了一些强关联规则,并建立了数据挖掘模型。最后对数据挖掘的结果(即影响煤矿安全隐患的最主要因素——瓦斯)进行详细的分析研究,并提出了几点有建设性的建议。该方案从数据仓库和数据挖掘角度为煤矿安全监测控制预警提供一种新的思路,同时为煤矿管理者提供决策依据,从而提高煤矿管理效率,对煤矿安全具有一定的实用性和参考价值。
刘昆[6](2008)在《针对时间序列数据的时态关联规则挖掘研究》文中研究说明自80年代开始,数据库技术得到了广泛的普及和应用。随着数据库容量的膨胀,特别是数据仓库以及Web等新型数据源的日益普及,人们面临的主要问题是“数据丰富,但信息贫乏”,即面对浩瀚的数据海洋,却不知该如何有效的地利用这些数据。面对这一问题的挑战,数据挖掘技术应运而生,并显示出强大的生命力。从海量的历史数据中挖掘出其背后蕴含的价值信息对揭发事物发展变化有着重要意义,同时也为科学决策和正确认识事物提供了依据。这些历史数据普遍具有时间性,因此,时间序列数据挖掘研究作为数据挖掘技术研究的重要组成部分,一直以来都受到广泛地重视,成为具有重要理论和实用价值的热点研究课题之一。本文针对时间序列数据的时态关联规则挖掘中时间序列数据表示,频繁序列挖掘,时态关联规则表示和时间序列预测等问题进行研究分析,在频繁序列挖掘和时态关联规则表示等方面取得了一些成果,主要研究工作和研究内容如下:在时序数据中,首先面对的时间区间、时态关系、和时间序列数据表示方法等问题,本文给出了时间序列数据的定义;针对股票交易数据应用,给出了一种相对斜率符号化方法。对已有互关联后继树模型进行了分析,发现此模型能够快速创建并保存挖掘序列的线索,从这个模型中任意分支按线索访问得到的序列是挖掘序列的子序列,根据这性质给出了查询控制机制,尽管如此,一些不需要访问的分支依然被访问到了;针对这一冗余问题,提出了互关联统计线索树模型,互关联统计线索树保存了时间序列的有序性,归并了同类序列,对同类序列创建了线索,避免了查询不必要分支,具有准确定位的特点。本文结合互关联后继树与互关联统计线索树各自优点,提出互关联后继树与互关联统计线索树挖掘频繁序列算法,使挖掘频繁序列的时间复杂度降至为O(可能频繁项的分支数)。对已有的时间序列挖掘思想进行研究,发现对间隔连续序列的研究工作几乎没有开展,本文提出了间隔频繁序列的定义及性质,给出关联加权有向图挖掘间隔频繁序列方法,利用有向图路的有向性保证时间序列有序性,利用加权找出构成可能间隔频繁序列的紧密非频繁序列;使用互关联后继树与统计线索树结合算法对连续非频繁项进行查询、验证、统计,从而得到间隔频繁序列。对时态关联规则进行研究,提出了相对支持度概念,用相对支持度对挖掘出来的连续频繁序列和间隔频繁序列进行表示,获取该时间序列的时态关联规则;利用时态关联规则对时间序列进行预测;通过实验对所提方法进行验证,验证了该算法是有效性、可行性。科技的进步,特别是信息产业的发展,把我们带入了一个崭新的信息时代。随着计算机应用的普及和数据库技术的不断发展,数据库管理系统的应用领域越来越广泛。特别是条形码和信用卡的普及和使用,进一步加速了商业、金融、保险等领域的信息化进程。人们已经用计算机取代了绝大部分手工操作,使信息数据库系统的信息源不断扩大。同时,海量存储设备不断涌现。面对这些海量和繁杂的信息,如何才能从中提取有价值的知识,是人们需要解决的问题。基于数据库的知识发现(KDD)及相应的数据挖掘就在这样的环境下出现了。数据挖掘是从大量、含有噪声的信息或数据中,挖掘出不为人知的规律或知识,从而更好的指导人们的生产、生活。目前,已经被用到各个领域。根据挖掘研究的数据不同,又有不同的分支;其中,有一类数据具有时间特性在里面,称之为时间序列数据,这类数据在日常生活、工作、生产和科技等各个领域涉足。对这类数据的挖掘是十分必要而且有意义的,对它的挖掘,称之为时间序列数据挖掘。时间序列数据挖掘是数据挖掘的一个分支,当然数据挖掘的经典方法对时间序列数据的挖掘有很好的指导作用,但是由于时间特性,不能将其方法全盘照搬到时间序列挖掘中。本文介绍了数据挖掘的一些基本知识,包括数据挖掘的背景、历史,数据挖掘过程;论述了目前比较流行的挖掘算法,比如传统统计方法、可视化技术、决策树、神经网络、遗传算法、关联规则挖掘算法、粗糙集方法、贝叶斯分类方法、模糊集方法、k-最临近分类法对这些算法做了简要的分析,指明各种算法论述的文章,以便读者需深入时查阅。时间数据序列挖掘是数据挖掘的一个重要组成部分,也是目前研究的热点问题之一。本文介绍了时间序列数据挖掘的目的、任务和方法,介绍时间序列数据变换方法、数据相似搜索、聚类/分类分析、数据可视化、时间序列分割与模式发现、时间序列预测等方法,总结了将来的发展方向。最后,对新动态进行了简单介绍。
林丽清[7](2007)在《Rough集和云理论在空间数据挖掘中的应用》文中研究表明随着现代科技和数据获取设备的迅速发展,空间数据库的数量和大小日益丰富,使得空间数据挖掘和知识发现变得越来越重要。而在数据挖掘过程中,存在大量冗余数据影响我们的决策,Rough集理论在得到决策规则和分类方面是最有利的根据。它不但可以在不影响数据表达信息的前提下使原来的数据量大为减少(数据约简),而且还可以产生决策规则,从而挖掘出数据中的有效模式。其次,Rough集理论不同于其他处理不确定性问题的理论,如概率方法、模糊集方法等,它无需提供任何所需处理数据集合之外的先验信息。然而Rough集理论要求所处理的决策表中的值必须用离散数据表达,因此在使用Rough集理论对数据挖掘前必须先对数据进行离散化处理。本文首先介绍了数据挖掘,空间数据挖掘的意义、使用的主要方法、获得的知识类型和过程,接着又介绍了Rough集的基础知识,为随后的深入研究做铺垫。其次开始深入研究Rough集在数据挖掘过程的核心问题—属性约简,对目前基于Rough集的属性约简算法展开分析,并比较了各种算法的性能。本文提出一种FAE算法,用于在属性约简前进行优化属性的选择,并在此基础上又建立了一个基于Rough集分析的分类器模型—FAERS模型,通过实验证明了这个算法的分类效果很好。而针对Rough集在挖掘一般决策表的最简规则或者所有规则是一个NP-hard问题,本文又引入蚁群算法,提出一种新的属性约间算法—ACR算法,将蚁群算法用于在对寻找约简属性的过程中指导搜索的方向,通过具体的例子证明了这个算法的有效性。随后,本文又介绍了云理论的相关知识,并具体研究一种基于云模型的离散化算法。在前面理论研究的基础上,本文提出一种基于GIS的空间数据挖掘原型系统,并通过具体的例子说明该系统的运行步骤。最后,在总结本文研究成果和不足之处的基础上阐述了空间数据挖掘的前景。
李皓[8](2007)在《数据挖掘中的规则提取》文中进行了进一步梳理遥感与GIS的发展目标之一是全自动化与智能化,在发展过程中,这个问题面临了许多困难和挑战,尤其是面对海量数据和地理信息系统实时及动态分析的需要,目前还没有真正地实现语义信息的自动提取。面对海量数据,人们迫切需要高效、自动、智能的手段处理数据,从中挖掘出可用于决策的东西。近年来,处理大量的,复杂的,综合的数据,并从中提取人们感兴趣的信息,已经成为一个研究热点。本文的研究就是以此为出发点,研究了一种新的数据挖掘中规则提取的方法。首先阐述了数据挖掘和知识发现这一新兴学科的背景知识和发展情况,并概括总结了多种数据挖掘的方法。其中着重讨论了与之有关的两种有关数据挖掘方法的理论—粗糙集理论和云理论,通过对比研究,提出这两种理论可以互相补充,有机地结合起来使用。本文对粗糙集理论和云理论的结合使用给出了一种有效的、可行的数据挖掘方法,利用云理论对数据进行预处理,再用粗集理论进行数据简约,从而发现分类决策知识,得到决策表,最后把云理论的不确定性推理方法应用于这些知识,从而表达和传递知识和推理的不确定性。这种方法能够有效地进行定性数据和定量数据之间的转换,增强知识发现的能力。最后,本文利用这种方法,以西安地裂缝活动强度的问题为对象,得到了关于地裂缝活动强度分区图,并根据云理论进行了规则提取,说明该方法是有效的。结果比较理想,与现实情况基本相符,其结果可作为专家决策的依据。
吉家锋[9](2007)在《连续属性的离散化及知识获取的研究》文中提出由于计算机的迅速普及和互联网的广泛流行,产生了数据和信息的汪洋大海。要想从中获取隐藏、有用的知识,就要使用各种学习算法和方法。而许多学习算法要求输入的属性值是离散的,由此引出了许多连续值属性的离散化的方法,如根据领域专家的经验给出相应的区间;或根据某种划分原则对输入空间进行划分,给出离散点进行离散化。根据是否利用类信息,离散化方法可分为有监督和无监督的方法;根据是对所有连续属性同时离散化还是单个属性单独离散化,可分为全局方法和局部方法;也可根据划分是在分类之前还是分类时做出的而分为静态方法和动态方法。常用的离散化的策略有:空间等分法、自适应方法、等频率区间法、基于类信息熵的方法等,在众多的离散化方法中,不论是哪一种,都很难得到一个直观的、容易理解的离散结果。在本文中,首先介绍了各种常见的离散化算法和方法。在此基础上,本文提出一个基于模糊语言的数据语言摘要和语言规则的抽取算法,通过对数据库的数据语言摘要的抽取和语言规则的抽取,达到对连续属性模糊离散化的目的。该离散化过程具有如下优点:(1)所得结果直观明了。若直接观察数据库,难以发现其中的知识。本文中提出的离散化算法也因为是用语言值描述的结果,离散结果容易理解;(2)所得结果都具有具体的支持度。可以给定某个阀值,给出各种支持度的语言命题和语言规则,满足各种不同的需求;(3)该抽取的过程智能程度较高,只需要输入每个语言值的阀值、摘要或规则的支持度阀值,就能输出自然语言的命题或规则。在抽取的过程中,首先根据属性值的分布特点,由专家给出合理的语言值隶属函数,或者是用遗传算法,确定较合理的语言值隶属函数,从而达到优化离散连续属性的目的。基于每一个语言值的隶属函数,计算每个对象在该语言值上的隶属度,超过给定阀值的对象做一记录,得到一个某种程度上符合某个语言值得对象集,同理,可以得到其他语言值的对象集,对这些对象集做交运算,得到在某种程度上的对象集交集。描述这个对象集的自然语言,就是该数据库上的一个语言命题。而从数据库中抽取语言规则的过程,和语言命题抽取过程大致类似。在介绍离散化的过程中,以Iris数据库为例,抽取出描述该数据库的语言命题和语言规则,并以得到的语言规则对其中的某些个体作判断,得到较好的结果。
陶颖[10](2007)在《改进的关联规则算法在学生就业问题上的应用研究》文中提出本文旨在研究如何将数据挖掘技术与学生就业问题相结合,从大量数据中挖掘隐藏在中等职业教育学校学生现有数据中的有用信息。本文介绍了数据挖掘相关知识,选取了关联规则中的Apriori算法为主要研究算法,并根据研究问题的需要,对Apriori算法进行了改进,将其应用于当前中等职业教育学校中,以解决学生就业的相关问题。同时根据当前中等职业教育学校中对学生就业问题管理的现状,阐述了其存在的不足。应用改进的Apriori算法对来自于不同学校、不同专业、不同学年的学生的就业情况进行了分析,找出了影响学生就业情况的一些因素,从而证实了利用数据挖掘的相关算法能够对中等职业教育学校的学生数据进行挖掘,职业教育信息中存在着关联规则,也证实了改进的Apriori算法在此问题上是有效的。
二、数据挖掘与知识发现(DMKD)及其应用的研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、数据挖掘与知识发现(DMKD)及其应用的研究(论文提纲范文)
(1)基于数据挖掘的短信业务研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 课题研究背景 |
1.2 关于数据挖掘的国内外研究现状 |
1.3 课题来源 |
1.4 研究方法和创新点 |
1.5 论文框架 |
第二章 数据挖掘理论基础及应用 |
2.1 数据挖掘概念 |
2.2 数据挖掘与传统分析方法的区别 |
2.3 数据挖掘研究功能和特点 |
2.4 数据挖掘的流程 |
2.5 数据挖掘的软件工具 |
2.6 数据挖掘应用简介 |
2.7 数据挖掘未来研究方向及热点 |
2.8 数据挖掘与BI和DSS |
第三章 数据挖掘算法 |
3.1 常用数据挖掘算法 |
3.2 决策树算法 |
3.3 聚类分析算法 |
3.4 关联规则算法 |
3.5 神经网络算法 |
第四章 针对短信的数据挖掘应用 |
4.1 研究的课题、预期结果 |
4.2 数据采集 |
4.3 数据清洗和浏览 |
4.4 建立数据源和数据源视图 |
4.5 建立短信数据挖掘的模型 |
4.6 模型验证 |
4.7 短信数据挖掘的结论 |
第五章 总结和展望 |
致谢 |
参考文献 |
附录A 相关数据表说明 |
附录B 挖掘DMX语句 |
1、创建挖掘结构 |
2、创建挖掘模型 |
3、处理挖掘结构 |
4、查询预测 |
5、创建预测 |
附录C 数据挖掘软件简要比较 |
(2)养生方数据挖掘分析系统的研制(论文提纲范文)
中文摘要 |
Abstracts |
引言 |
第一部分 中医养生方剂与现代信息技术 |
1 养生需求与养生方 |
1.1 养生需求 |
1.2 养生方 |
2 养生方的形成发展历史 |
2.1 萌芽期(先秦至南北朝) |
2.2 成形期(唐) |
2.3 发展期(宋元) |
2.4 成熟期(明清) |
2.5 提高期(近现代) |
4 现代信息技术在方剂研究方面的应用现状 |
4.1 方剂检索数据库 |
4.2 现代信息技术在养生方剂方面的应用现状 |
5 本文主要目标 |
第二部分 关联规则挖掘算法与软件工程 |
1 引言 |
2 关联规则 |
2.1 关联规则挖掘的过程 |
2.2 Apriori算法 |
3 算法的基本思想 |
4 Apriori核心算法分析 |
5 软件工程 |
第三部分 养生方组成预处理 |
1 引言 |
2 初步预处理 |
2.1 算法概述 |
2.2 结果分析 |
3 中药食物名称的规范 |
3.1 与中药食物表的映射建立初步 |
3.2 映射建立步骤 |
3.3 结果分析 |
第四部分 方剂数据维护系统 |
1 引言 |
2 系统需求分析 |
3 系统架构 |
4 系统使用细节概述 |
4.1 增删改查界面 |
4.2 使用增删改查界面完成中药别名的维护 |
4.3 关联规则 |
4.4 使用关联规则模块分析 |
第五部分 设计养生方数据挖掘分析系统 |
1 系统基础 |
1.1 信息处理技术 |
1.2 数据仓库 |
1.2.1 建造养生方数据仓库 |
1.2.2 概念模型设计 |
1.2.3 逻辑模型设计 |
2 数据筛选 |
2.1 延年益寿、补虚抗衰养生方的特点 |
2.2 筛选过程与数据处理 |
2.3 筛选标准 |
2.3.1 养生方来源的选择 |
2.3.2 本论文养生方收录流程 |
3 使用演示 |
3.1 常规数据检索功能 |
3.2 数据挖掘功能 |
4 结果分析 |
4.1 养生方高频药物挖掘结果 |
4.2 分析与评价 |
4.2.1 药对 |
4.2.2 量化表达配伍之间的关系 |
4.2.3 支持度与置信度 |
4.2.4 普遍性与紧密性 |
4.2.5 数据挖掘与传统统计学的区别 |
4.2.6 分析结果是否合理 |
4.2.7 该系统前景与展望 |
致谢 |
参考文献 |
附录 |
文献综述 |
攻读学位期间主要研究成果及发表论文 |
附表 |
(3)空间数据挖掘和知识发现的研究(论文提纲范文)
1 空间数据挖掘和知识发现的概述 |
2 空间数据挖掘和知识发现研究 |
2.1 空间关联规则 |
2.2 空间特征规则 |
2.3 空间分类规则 |
2.4 空间聚类规则 |
3 空间数据挖掘和知识发现与其他学科的联系 |
3.1 S DMKD与DM和传统地学数据分析的关系 |
3.2 S DMKD与地学数据分析的关系 |
3.3 S DMKD与空间数据库的关系 |
3.4 S DMKD与数字地球的关系 |
4 空间数据挖掘和知识发现的理论和方法展望 |
(4)数据挖掘技术在国内外的研究和发展现状(论文提纲范文)
一、数据挖掘技术的定义和特点 |
二、国外研究和发展现状 |
1. 起源和发展 |
2. 研究机构 |
3. 刊物和网站 |
4. 国外的应用情况 |
三、国内研究和发展现状 |
1. 我国的研究现状 |
2. 国内的研究机构和专门的网站 |
3. 近期的研究交流成果 |
4. 国内的应用情况 |
四、数据挖掘未来可能的研究方向 |
(5)数据挖掘在煤矿安全预测预警中的应用研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 论文研究背景及意义 |
1.2 国内外研究现状 |
1.3 主要内容及创新点 |
1.4 论文结构 |
1.5 本章小结 |
2 数据挖掘技术分析研究 |
2.1 数据仓库技术研究 |
2.1.1 数据仓库提出的背景 |
2.1.2 数据仓库简述 |
2.1.3 数据仓库系统结构研究 |
2.2 数据挖掘技术研究 |
2.2.1 定义 |
2.2.2 主要内容及挖掘任务 |
2.2.3 数据挖掘流程 |
2.3 数据挖掘算法分类及评价方法 |
2.3.1 算法分类 |
2.3.2 数据挖掘算法的评价 |
2.4 本章小结 |
3 关联规则的问题描述及相关算法 |
3.1 问题描述 |
3.2 关联规则挖掘方法 |
3.2.1 挖掘关联规则的一般步骤 |
3.2.2 主要研究方向和典型算法 |
3.3 相关算法思想及描述 |
3.3.1 多循环方式的挖掘算法 |
3.3.2 并行发现算法 |
3.4 本章小结 |
4 煤矿监控系统数据仓库的架构分析与设计 |
4.1 概述 |
4.1.1 基本描述 |
4.1.2 总体目标 |
4.2 框架结构 |
4.2.1 总体框架 |
4.2.2 数据仓库系统框架结构 |
4.2.3 监控数据仓库实施策略 |
4.3 系统建设 |
4.3.1 系统网络运行结构 |
4.3.2 系统体系结构 |
4.4 本章小结 |
5 数据挖掘在煤矿监控系统中的应用研究 |
5.1 煤矿监控系统数据仓库设计 |
5.1.1 需求分析 |
5.1.2 监控数据仓库体系结构设计 |
5.1.3 监控数据仓库概念模型设计 |
5.1.4 监控数据仓库逻辑模型设计 |
5.1.5 监控数据仓库的实现 |
5.2 关联规则算法在煤矿监控系统中的应用研究 |
5.2.1 数据清洗与集成 |
5.2.2 数据挖掘模型的研究与设计 |
5.2.3 挖掘数据中的规则 |
5.2.4 结果分析 |
5.3 本章小结 |
6 总结 |
6.1 进一步研究的方向 |
6.2 结束语 |
参考文献 |
附录 |
致谢 |
(6)针对时间序列数据的时态关联规则挖掘研究(论文提纲范文)
针对时间序列数据的时态关联规则挖掘研究 |
摘要 |
Abstract |
第1章 引言 |
1.1 研究背景与意义 |
1.2 本文工作 |
1.3 论文组织结构 |
第2章 时间序列数据的符号化表示 |
2.1 时序逻辑基本知识 |
2.1.1 确定时间的概念与时间序列数据定义 |
2.1.2 时态关系 |
2.2 时间序列数据表示 |
2.2.1 时间序列数据符号表示的必要性 |
2.2.2 时间序列数据符号表示法 |
2.2.3 针对股票数据应用的问题表示 |
2.3 本章小结 |
第3章 连续频繁序列的挖掘 |
3.1 连续频繁序列及其性质 |
3.1.1 关联规则与频繁项集 |
3.1.2 时态关联规则及其特性 |
3.1.3 连续频繁序列 |
3.2 互关联后继树模型 |
3.2.1 互关联后继树定义与性质 |
3.2.2 基于互关联后继树挖掘多元频繁序列的方法 |
3.3 互关联统计线索树 |
3.3.1 互关联线索树定义及性质 |
3.3.2 IRST与IRSCT挖掘算法 |
3.4 本章小结 |
第4章 间隔频繁序列的挖掘 |
4.1 间隔频繁序列定义与性质 |
4.2 利用加权有向图挖掘间隔频繁序列的算法 |
4.3 本章小结 |
第5章 时态关联规则表示和时序数据预测 |
5.1 时态关联规则表示 |
5.2 时间序列预测 |
5.3 本章小结 |
第6章 实验分析 |
6.1 实验数据存储与符号化 |
6.2 互关联后继树与统计线索树创建以及频繁序列挖掘 |
6.2.1 互关联后继树与统计线索树创建 |
6.2.2 频繁序列挖掘与算法比较分析 |
6.3 规则表示与预测 |
第7章 总结与展望 |
7.1 小结 |
7.2 未来的研究方向 |
参考文献 |
攻读学位期间发表的学术论文和研究成果 |
致谢 |
数据挖掘算法与时间序列数据挖掘算法研究综述 |
摘要 |
Abstract |
第1章 数据挖掘简介 |
1.1 概述 |
1.1.1 知识发现和数据挖掘概念 |
1.1.2 数据挖掘逐渐演变的过程 |
1.1.3 研究历史 |
1.1.4 出版物及工具 |
1.1.5 国内现状 |
1.1.6 业界观点 |
1.2 数据挖掘过程 |
1.2.1 问题定义 |
1.2.2 准备数据 |
1.2.3 浏览数据及数据预处理 |
1.2.4 生成模型以及验证模型 |
1.2.5 部署和更新模型 |
1.3 数据挖掘的方法和技术 |
1.3.1 数据准备以及数据预处理的相关技术 |
1.3.2 数据挖掘算法与分析 |
1.4 数据挖掘所发现的知识 |
1.4.1 自动预测趋势和行为 |
1.4.2 关联分析 |
1.4.3 聚类 |
1.4.4 概念描述 |
1.4.5 偏差检测 |
1.5 数据挖掘工具 |
1.6 数据挖掘未来研究方向 |
1.7 数据挖掘解决的典型商业问题 |
1.8 本章小结 |
第2章 时序数据及时序数据挖掘简介 |
2.1 概述 |
2.2 时序逻辑基础知识 |
2.2.1 确定时间的概念与时态关系 |
2.2.2 时态语义 |
2.2.3 时间序列数据的表示和符号化 |
2.3 时间序列数据挖掘的主要研究内容 |
2.3.1 时间序列数据变换 |
2.3.1.1 离散傅里叶变换数据表示 |
2.3.1.2 奇异值分解数据表示 |
2.3.1.3 离散小波变换数据表示 |
2.3.2 时间序列数据相似搜索 |
2.3.3 时间序列聚类/分类分析 |
2.3.4 时间序列数据可视化 |
2.3.5 时间序列分割与模式发现 |
2.3.6 时间序列预测 |
2.3.6.1 基于统计学理论的顶测方法 |
2.3.6.2 神经网络预测法 |
2.3.6.3 模糊数学预测法 |
2.3.6.4 混沌预测法 |
2.3.6.5 状态空间预测法 |
2.3.6.6 组合预测法 |
2.3.7 TSDM应用研究 |
2.4 未来的研究方向 |
2.5 本章小结 |
第3章 新动态与新热点简介 |
3.1 流数据挖掘 |
3.2 隐私保护数据挖掘算法 |
3.3 空间数据挖掘 |
3.4 其它新方向 |
3.5 本章小结 |
参考文献 |
Study of Temporal Association Rules Mining for the Time-SeriesData |
Abstract |
Chapter 1 Introduction |
1.1 Background and Significance |
1.2 This paper work |
1.3 Papers organizational structure |
Chapter 2 Time-series data of symbols |
2.1 Sequential logic basic knowledge |
2.1.1 Determine the time and the concept of time-series data definition |
2.1.2 Tense relations |
2.2 Time-series data of denotation |
2.2.1 Time-series data that the need for symbols |
2.2.2 Time-series data symbols law |
2.2.3 Application of the stock data for time series data symbol of denotation |
2.3 Summary of this chapter |
Chapter 3 Close frequent sequence of mine |
3.1 Close and continuous nature of the frequent sequence |
3.1.1 Association rules and frequent itemsets |
3.1.2 Temporal association rule |
3.1.3 closely frequent sequence |
3.2 Inter Relevant Successive Trees |
3.2.1 IRST of definition and nature |
3.2.2 Based on IRST Mining frequent sequence of multiple methods |
3.3 Inter Relevant Statistics Clues Trees |
3.4 Summary of this chapter |
Chapter 4 Mine gap frequent sequence |
4.1 Gap frequent sequence of definition and nature |
4.2 Use the weighted directed graph to mine Gfs |
Chapter 5 Temporal association rules of denotation and prediction of time series data |
5.1 Temporal association rules of denotation |
5.2 Prediction of time series data |
Chapter 6 Experimental Analysis |
6.1 Experimental data storage and symbols |
6.2 IRST and IRSCT of creation and frequent items mine |
6.2.1 IRST and IRSCT of creation |
6.2.2 Mine frequent item and algorithm compared |
6.3 Denotation of rules and prediction |
Chapter 7 Summary and Prospects |
7.1 Summary |
7.2 The Future Direction |
Study of Data Mining Algorithms and Time-Series Data MiningAlgorithms |
Abstract |
Chapter 1 Introduction of data mining |
1.1 Overview |
1.1.1 What is knowledge discovery and data mining |
1.1.2 Data Mining gradually evovling process |
1.1.3 Study history |
1.1.4 Publications and tools |
1.1.5 Domestic status quo |
1.1.6 The industry point of view |
1.2 Data mining process |
1.2.1 Definition of the problem |
1.2.2 Ready data |
1.2.3 Browser data and data preprocessing |
1.2.4 Generation models and model verification |
1.2.5 Deployment and updating model |
1.3 Data mining methods and techniques |
1.3.1 Data and prepare the relevant technical data preprocessing |
1.3.2 Data mining algorithms and analysis |
1.4 Data Mining found knowledge |
1.4.1 Automatically forecast trends and |
1.4.2 Correlation Analysis |
1.4.3 Clustering |
1.4.4 Concept description |
1.4.5 Error detection |
1.5 Data mining tools |
1.6 On the future direction of data mining |
1.7 The typical data mining to solve business problems |
1.8 Summary of this chapter |
Chapter 2 Time-series data in time sequence data mining Profile |
2.1 Summary |
2.2 Sequential logic basic knowledge |
2.2.1 Establish the concept of time and tense relations |
2.2.2 Temporal semantics |
2.2.3 That the time-series data and symbols of |
2.3 Time-series data mining on the main content |
2.3.1 Time-series data transformation |
2.3.1.1 Discrete Fourier transform that data |
2.3.1.2 SVD data that |
2.3.1.3 DWT data that |
2.3.2 Time-series data similar search |
2.3.3 Time series clustering/classification analysis |
2.3.4 Time-series data visualization |
2.3.5 Time series split with the pattern found |
2.3.6 Time series prediction |
2.3.6.1 Arguments based on statistical method of measuring the top Conclusion |
2.3.6.2 Neural network forecasting method |
2.3.6.3 Fuzzy prediction method |
2.3.6.4 Chaotic prediction method |
2.3.6.5 State space prediction method |
2.3.6.6 Combination of forecast |
2.3.6.7 Other technologies |
2.3.7 TSDM Applied Research |
2.4 On the future direction |
2.5 Summary of this chapter |
Chapter 3 new developments and new hot spot for brief |
3.1 Flow of data mining |
3.2 Privacy of data mining algorithms |
3.3 Spatial Data Mining |
3.4 Other new direction |
3.5 Summary of this chapter |
(7)Rough集和云理论在空间数据挖掘中的应用(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 数据挖掘 |
1.1.1 数据挖掘的提出 |
1.1.2 数据挖掘的定义 |
1.1.3 数据挖掘的过程 |
1.1.4 数据挖掘的三步曲 |
1.1.5 数据挖掘的方法 |
1.1.6 数据挖掘的对象 |
1.1.7 数据挖掘的任务 |
1.1.8 数据挖掘的发展现状和前景 |
1.2 空间数据挖掘 |
1.2.1 空间数据挖掘和知识发现的定义和特点 |
1.2.2 空间数据仓库与空间数据挖掘 |
1.2.3 从空间数据库可发现的知识类型 |
1.2.4 空间数据挖掘的方法 |
1.2.5 空间数据挖掘系统的体系结构和开发策略 |
1.3 本论文的组织结构 |
第二章 Rough集合 |
2.1 Rough集的提出 |
2.2 Rough集的基本概念和性质 |
2.2.1 Rough集的基本概念 |
2.2.2 Rough集下近似和上近似的基本性质 |
2.2.3 Rough集中的成员关系 |
2.2.4 不精确性的数字特征 |
2.2.5 不精确性的拓扑特征化 |
2.2.6 分类的近似 |
2.2.7 集合的粗略相等和粗略包含 |
2.3 属性值系统 |
2.4 属性的依赖 |
2.5 属性的简化与属性系统的核 |
2.6 属性的重要性 |
2.7 决策表的分析和简化 |
2.7.1 决策表的定义与性质 |
2.7.2 决策表的简化与最小决策算法生成 |
2.8 举例说明 |
2.8.1 例一 |
2.8.2 例二 |
2.9 小结 |
第三章 基于 Rough集的属性约简算法的研究 |
3.1 数据约简的现状 |
3.1.1 数据约简 |
3.1.2 属性约简 |
3.1.3 基于 Rough集的属性约简算法 |
3.2 FAE方法——一种优化属性选择方法 |
3.2.1 信息熵的相关知识 |
3.2.2 属性选择 |
3.2.3 FAERS分类器模型 |
3.2.4 实验研究 |
3.2.5 结论 |
3.3 蚁群算法在属性约简中的应用 |
3.3.1 蚁群算法 |
3.3.2 具体算法流程 |
3.3.3 实验与结果分析 |
3.3.4 结论 |
3.4 小结 |
第四章 云理论 |
4.1 云理论 |
4.1.1 云理论的提出 |
4.1.2 云理论的基本概念 |
4.1.3 云模型 |
4.1.4 云发生器 |
4.1.5 虚拟云 |
4.2 云理论在数据挖掘中的应用 |
4.2.1 基于云模型的概念和知识表达 |
4.2.2 云理论与Rough集的结合 |
4.3 基于云模型的离散化算法 |
4.3.1 不确定程度 |
4.3.2 峰值法云变换算法 |
4.3.3 基于云理论的离散化算法 |
4.4 小结 |
第五章 基于 Rough集和云理论的空间数据挖掘系统 |
5.1 空间数据挖掘系统的模型 |
5.2 空间数据挖掘原型系统的具体运用 |
5.2.1 目标数据集的选择 |
5.2.2 数据预处理 |
5.2.3 数据转换 |
5.2.4 空间数据分类 |
5.2.5 对挖掘结果的分析与应用 |
5.3 小结 |
第六章 总结 |
6.1 工作总结 |
6.2 进一步需要做的工作 |
参考文献 |
附录1 |
附录2 |
致谢 |
研究成果及发表的学术论文 |
作者简介 |
硕士研究生学位论文答辩委员会决议书 |
(8)数据挖掘中的规则提取(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 数据挖掘背景 |
1.1.1 GIS发展现状 |
1.1.2 数据挖掘和知识发现的意义 |
1.1.3 数据挖掘产生的背景 |
1.1.4 数据挖掘和知识发现的发展和现状 |
1.1.5 DMKD的主要研究内容 |
1.1.6 数据发掘和知识发现的研究方法与策略 |
1.2 空间挖掘和知识发现在GIS与遥感中的应用 |
1.2.1 GIS智能化分析 |
1.2.2 在遥感影像解释中的应用 |
1.3 空间数据发掘和知识发现的方法 |
1.3.1 统计方法 |
1.3.2 归纳方法 |
1.3.3 聚类方法 |
1.3.4 关联规则发掘方法 |
1.3.5 Rough集方法 |
1.3.6 云理论 |
1.3.7 神经网络 |
1.3.8 遗传算法 |
1.4 空间数据挖掘的任务 |
1.5 数据发掘和知识发现面临的困难 |
1.6 本文的主要研究内容 |
第二章 理论基础 |
2.1 粗糙集理论 |
2.1.1 信息表知识表达系统 |
2.1.2 粗糙集理论基础 |
2.1.3 数据约简 |
2.1.4 不一致推理策略 |
2.1.5 决策算法的最小化 |
2.2 云理论 |
2.2.1 概念 |
2.2.2 基于云理论的不确定性推理 |
2.2.3 云理论在GIS中的应用价值 |
2.3 基于云模型的数据挖掘 |
2.3.1 基于云模型的空间概念表达 |
2.3.2 基于云模型的知识表达 |
2.3.3 基于云模型的概念生成方法 |
2.3.4 云模型从空间数据发现关联知识 |
2.4 连续数据离散化 |
2.4.1 连续数据离散化相关研究 |
2.4.2 最大方差法连续数据离散化 |
2.4.3 最大方差法与云理论的结合 |
第三章 云理论与粗集结合进行数据挖掘的模型建立 |
3.1 结合的优势 |
3.2 结合的方法 |
3.3 处理方法 |
3.3.1 收集数据 |
3.3.2 建立决策表 |
3.3.3 数据预处理 |
3.3.4 数据离散化 |
3.3.5 属性约简 |
3.3.6 属性重要性的计算 |
3.3.7 决策规则最小化的提取 |
3.3.8 云理论提取规则 |
第四章 西安地裂缝问题的实例分析 |
4.1 地裂缝分布状况 |
4.2 地裂缝成因及其强烈活动的影响因素 |
4.3 利用云理论和粗集方法结合进行地裂缝数据分析 |
4.3.1 数据收集 |
4.3.2 数据预处理 |
4.3.3 数据的离散化 |
4.3.4 属性约简 |
4.3.5 属性重要性计算 |
4.3.6 规则提取 |
第五章 结论与建议 |
参考文献 |
致谢 |
(9)连续属性的离散化及知识获取的研究(论文提纲范文)
摘要 |
Abstract |
第一章 前言 |
1.1 数据的迅速膨胀 |
1.2 数据挖掘是知识获取的新技术 |
1.3 数据挖掘是多学科交叉 |
1.4 属性离散化的意义 |
1.5 国内外研究简述 |
1.6 本文主要研究内容 |
1.7 本文的内容结构 |
第二章 基础知识 |
2.1 粗糙集基础知识 |
2.1.1 粗糙集理论的基本概念 |
2.1.2 粗糙集模型的应用-从数据库中发现知识 |
2.2 信息系统与知识发现 |
2.2.1 隶属函数的定义 |
2.2.2 信息系统的定义 |
2.2.3 信息系统需要研究的问题 |
2.2.4 决策信息系统简述 |
2.2.5 决策信息系统与知识发现 |
2.3 属性离散化原理 |
2.4 常见离散化算法 |
2.5 数据挖掘的一般流程 |
2.5.1 数据挖掘环境示意图 |
2.5.2 数据挖掘过程图 |
2.5.3 数据挖掘的本质 |
第三章 信息系统的语言命题抽取 |
3.1 模糊聚类的数学描述 |
3.2 从信息系统中抽取简单语言命题 |
3.2.1 简单语言命题的结构 |
3.2.2 简单语言命题抽取过程 |
第四章 决策信息系统的规则抽取 |
4.1 抽取简单语言规则 |
4.1.1 简单语言规则的格式 |
4.1.2 简单语言规则抽取过程 |
4.2 抽取复杂语言规则 |
4.2.1 复杂语言规则的格式 |
4.2.2 复杂语言规则的抽取过程 |
结论 |
参考文献 |
攻读学位期间的科研成果 |
致谢 |
附录: Matlab验证程序 |
(10)改进的关联规则算法在学生就业问题上的应用研究(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 论文研究的背景 |
1.1.1 时代的挑战 |
1.1.2 数据挖掘内容和本质 |
1.1.3 数据挖掘发展方向 |
1.2 问题研究的意义 |
1.3 系统现有功能简介 |
2 数据挖掘技术综述 |
2.1 数据挖掘的概念 |
2.2 数据挖掘的功能和分类 |
2.2.1 数据挖掘的功能 |
2.2.2 数据挖掘系统的分类 |
2.3 数据挖掘的过程 |
3 关联规则算法研究及改进 |
3.1 关联规则的基本概念 |
3.2 关联规则的分类 |
3.3 关联规则挖掘的经典算法—— Apriori算法 |
3.3.1 使用候选项集找频繁项集 |
3.3.2 由频繁项集产生强关联规则 |
3.3.3 Apriori算法 |
3.4 Apriori算法的改进 |
3.4.1 中等职业学校学生信息的特点 |
3.4.2 Apriori算法应用于教育领域的缺陷 |
3.4.3 对Apriori算法的改进 |
3.4.3.1 聚类的基本内容 |
3.4.3.2 算法的具体改进方法 |
3.5 新旧算法的比较 |
3.6 算法的验证 |
4 系统设计与实现 |
4.1 系统设计原则 |
4.2 系统结构 |
4.2.1 数据采集 |
4.2.2 数据预处理 |
4.3 数据表含义 |
5 改进的关联规则算法在职业教育领域中的应用 |
5.1 常用数据挖掘软件简介 |
5.2 算法在应用平台上的结构设计 |
5.3 算法在应用平台上的实现 |
5.4 应用结果的比较与分析 |
5.4.1 改进算法应用取得的成果 |
5.4.2 改进算法属性选择的过程 |
5.4.3 影响应用结果的因素 |
5.4.3.1 因素一分析 |
5.4.3.2 因素二分析 |
5.4.4 改进算法在实际应用上的结果分析与研究 |
5.4.4.1 应用结果分类 |
5.4.4.2 第一类规则的具体描述说明 |
5.4.4.3 第二类规则的具体描述说明 |
5.4.4.4 第三类规则的具体描述说明 |
5.5 改进算法应用的实际意义 |
6 总结与展望 |
6.1 主要工作 |
6.2 进一步研究方向 |
攻读硕士学位期间发表的学术论文 |
致谢 |
参考文献 |
四、数据挖掘与知识发现(DMKD)及其应用的研究(论文参考文献)
- [1]基于数据挖掘的短信业务研究[D]. 赵其朋. 西安电子科技大学, 2010(05)
- [2]养生方数据挖掘分析系统的研制[D]. 廖赛恩. 湖南中医药大学, 2010(03)
- [3]空间数据挖掘和知识发现的研究[J]. 马黎,王颖. 广西轻工业, 2009(09)
- [4]数据挖掘技术在国内外的研究和发展现状[J]. 陈卓民. 青年文学家, 2009(16)
- [5]数据挖掘在煤矿安全预测预警中的应用研究[D]. 柳亮亮. 河南理工大学, 2009(S2)
- [6]针对时间序列数据的时态关联规则挖掘研究[D]. 刘昆. 云南师范大学, 2008(S1)
- [7]Rough集和云理论在空间数据挖掘中的应用[D]. 林丽清. 北京化工大学, 2007(05)
- [8]数据挖掘中的规则提取[D]. 李皓. 长安大学, 2007(02)
- [9]连续属性的离散化及知识获取的研究[D]. 吉家锋. 西华大学, 2007(03)
- [10]改进的关联规则算法在学生就业问题上的应用研究[D]. 陶颖. 辽宁工程技术大学, 2007(06)