解读分析服务中的数据挖掘功能_SyBase_学习笔记★闵涛★计算机学习电脑编程软硬件技巧


	转至繁体中文版	\| 网站首页 \| 图文教程 \| 资源下载 \| 站长博客 \| 图片素材 \| 武汉seo \| 武汉网站优化 \|

解读分析服务中的数据挖掘功能

作者：闵涛文章来源：闵涛的学习笔记点击数：1000 更新时间：2009/4/22 22:54:36

　　数据挖掘是SQL Server 2000中最令人激动的新功能之一。我将数据挖掘看作是一个能够自动分析数据以获取相关信息的过程，数据挖掘可以和任一关系数据库或者OLAP数据源集成使用，但它和OLAP的集成所带来的好处却是极为显著的。因为结构化的数据源使得用户无需再向数据挖掘算法提供海量信息了。尽管不是什么专家，但我从同事Greg Bernhardt那里学到东西已经足够我来对数据挖掘作一翻解释了，我还希望由此使得分析服务的数据挖掘功能不再神秘并向你展示如何在分析应用中使用数据挖掘。

　　数据挖掘功能

　　数据挖掘弥补了分析服务功能中的重要不足之处。微软在SQL Server 7.0中引入了针对特定问题的分析和探测性分析功能。在针对特定问题的分析中，分析器要清楚用户需要回答什么问题并简单地利用OALP引擎获取相关信息。例如，一个快餐店的经理可能想知道：“最近四个季度，汉堡包的营业额和利润怎么样？”

　　在探测性分析中，分析器可能对用户的兴趣有所了解，但不需要回答具体的问题。例如，一个公司可能知道自己的一些零售商店没有利润，但却不知道原因何在。分析器在一个OLAP多维数据集中通过获取更多的细节资料，进行多维查找，获得最感兴趣的数据,我们称这一过程为数据冲浪。

　　数据挖掘同“针对特定问题”的分析和探测性分析都不相同。通过数据挖掘，分析服务可以浏览信息，寻找相关数据并提交数据。数据挖掘可以说是探测性分析的理想搭档。

　　SQL Server 2000通过新的API━━OLE DB for Data Mining（OLE DB for DM）实现了数据挖掘的功能，这是一个为方便各种应用程序使用数据挖掘功能而设计的编程接口。通过OLE DB for DM, 微软提供了两种数据挖掘算法（其它软件供应商也可以插入新的算法）。理论上，利用OLE DB for DM开发的分析程序能够使用新发明的算法。

　　SQL Sever 2000中包含的两种算法是决策树和群。决策树将信息分类为一个树状结构，可以帮助我们预测数据的某些特性。例如，可以将用户信息（如收入、婚姻状况及受教育程度）交由决策树算法，对预测该用户是否具有信用风险提供帮助。可以用群集算法寻找数据中的自然分组。例如，可以将所有的用户信息送入群集算法，要求把所有客户分为三个组。算法可能会找到一个已婚、受教育程度较高而收入偏低的分组，一个单身、高收入的分组和一个受教育程度较低而收入较高的分组。通过进一步的分析可能个发现每个分组都有一个特定的购物方式。利用这些资料，我们可以进行高效益、针对性强的广告活动。注意第二、三分组并没有完全使用所有的三项输入的信息，因为对于分组来说，并不是所有的输入信息都很重要。因此，第二组的描述之所以不包括受教育程度是由于分组不是根据教育水平来划分的。

没有相关教程

教程录入：mintao 责任编辑：mintao

上一篇教程：用COM自动服务扩展SQL Server功能

下一篇教程： PowerBuilder创建动态数据窗口综述

【字体：小大】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口】

注：本站部分文章源于互联网，版权归原作者所有！如有侵权，请原作者与本站联系，本站将立即删除！本站文章除特别注明外均可转载，但需注明出处！ [MinTao学以致用网]

　网友评论：（只显示最新10条。评论内容只代表网友观点，与本站立场无关！）

同类栏目

· Sql Server  · MySql
· Access  · ORACLE
· SyBase  · 其他

热门推荐

没有教程

赞助链接

闵涛博文

500 - 内部服务器错误。

您查找的资源存在问题，因而无法显示。

鄂公网安备 42011102001154号

站长：MinTao ICP备案号：鄂ICP备11006601号-18

闵涛站盟:医药大全-武穴网。A打造B、C、D……