select命令使用经验(2)--打印文章

打印本文

关闭窗口

select命令使用经验(2)

作者：武汉SEO闵涛文章来源：敏韬网点击数1174 更新时间：2009/4/24 21:43:57 文章录入：mintao 责任编辑：mintao

p class=left>【having的使用技巧】
　　having参数一般是与group by参数使用，是告诉SQL将那些符合过滤条件的组别含入查询结果中。不过在条件式中不能包含一个子查询。但如果having不与group by一同使用时，它就与where参数类似。但两者有两个区别导致having是不会快过where参数的。
select的条件过滤的先后顺序是这样的(我是根据经验而猜得，不知对否)：先对join中的on表达式进行过滤，再到where，中间结果出来后再用having进行过滤，最后才把结果显示出来。所以说having是对select结果的最后一次过滤。它与where的分别就是where能够事先把不要的数据过滤掉，这样select里头就不用处理那么多的数据。但有些数据事先不知道要不要过滤，要根据结果才能确定，这时才用having这个事后诸葛亮。但因为having是事后诸葛亮，对结果产生再进行条件筛选的，所以不能使用Rushmore，其效率可想而知有多高了。
这里兴修例子来比较一下on、where、having的不同之处
表recdbf内容如下：　　　　　　　　　　　　　　　　还有一个tempyf的辅助表，记录12个月

日期性质 yf 2000年7月3日特大 1 2000年7月9日特大 2 2000年9月3日特大 3 1999年3月2日一般 4 1999年3月4日一般 5 2000年1月3日一般 6 2000年2月1日一般 td> 2000年2月3日一般 8 2000年3月4日一般 9 2000年8月7日一般 10 2000年11月2日一般 11 1999年2月3日重大 12 2000年2月3日重大 2000年5月2日重大 2000年8月9日重大

on的命令如下
SELECT tempyf.*,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("一般",recdbf.性质)=0,0,1)) AS 一般,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("重大",recdbf.性质)=0,0,1)) AS 重大,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("特大",recdbf.性质)=0,0,1)) AS 特大;
　FROM tempyf LEFT OUTER JOIN recdbf ;
　　ON tempyf.yf = MONTH(recdbf.日期).AND.YEAR(日期) = ?yy;
　GROUP BY tempyf.yf
其中yy=2000，表示统计2000年的数据
用where的命令如下：
SELECT tempyf.*,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("一般",recdbf.性质)=0,0,1)) AS 一般,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("重大",recdbf.性质)=0,0,1)) AS 重大,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("特大",recdbf.性质)=0,0,1)) AS 特大;
　FROM tempyf LEFT OUTER JOIN recdbf ;
　　ON tempyf.yf = MONTH(recdbf.日期);
　GROUP BY tempyf.yf ;
where YEAR(日期) = ?yy &&注意，条件从on移到这里来了
用having的命令如下：
SELECT tempyf.*,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("一般",recdbf.性质)=0,0,1)) AS 一般,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("重大",recdbf.性质)=0,0,1)) AS 重大,;
　　SUM(IIF(ISNULL(recdbf.日期).OR.AT("特大",recdbf.性质)=0,0,1)) AS 特大;
　FROM tempyf LEFT OUTER JOIN recdbf ;
　　ON tempyf.yf = MONTH(recdbf.日期);
　GROUP BY tempyf.yf ;
having YEAR(日期) = ?yy &&注意，条件从on移到这里来了
on的结果如下，这是正确的

YF 一般重大特大 1 1 0 0 2 2 1 0 3 1 0 0 4 0 0 0 5 0 1 0 6 0 0 0 7 0 0 2 8 1 1 0 9 0 0 1 10 0 0 0 11 1 0 0 12 0 0 0

用where的结果如下：

YF 一般重大特大 1 1 0 0 2 2 1 0 3 1 0 0 5 0 1 0 7 0 0 2 8 1 1 0

用having的结果如下：

YF 一般重大特大 1 1 0 0 2 2 2 0 5 0 1 0 7 0 0 2 8 1 1 0 9 0 0 1 11 1 0 0

各位看到有什么不同吗？
　　on是把先把recdbf中不是2000年的记录过滤掉，剩下的就是2000年的了，再用tempyf去和它们进行外联接，其结果可用
sele tempyf.*,recdbf.日期 ;
from tempyf left join recdbf ;
ON tempyf.yf = MONTH(recdbf.日期).AND.YEAR(日期) = yy;
　GROUP BY tempyf.yf
　　来查看，这个中间结果出来后，再用isnull把空值的记录变成0或1，然后由sum去统计，结果就出来了
而where呢，
　　1、它是先把tempyf外联接recdbf, 相当于sele tempyf.*,recdbf.* from tempyf left join recdbf on tempyf.yf=mont(recdbf.日期)
　　2、然后把不是2000的记录过滤掉，这里要注意的是，如果某个月没有记录的话，那在第一个步骤后日期那里是null值，这当然不是2000的记录，所以就给这个条件给过滤出去了，所以下一步的sum之后就只剩下那有记录的那个月了，象4、6月等几个月。就没有
　　3、然后进行sum(……)

再看having
　　1、第一步和where一样，
　　2、第二步不同，它是先sum()，这里的sum可不管你是1999年还是2000的，先累加起来再说，这时，1999和2000年的2月份都有“重大”这个记录，sum的结果是2，这里用第三个步骤去分辨这个2之中那个是1999年的，那个是2000的，这当然分不清啦，所以也错了。
　　3、根据步骤2来把2000的过滤出来。

　　所以on、where、having这三个都可以加条件的子句中，on是最先执行，where次之，having最后。但有时候如果这先后顺序不影响中间结果的话，那最终结果是相同的。但因为on是先把不符合条件的记录过滤后才进行统计，它就可以减少中间运算要处理的数据，按理说应该速度是最快的。根据上面的分析，可以知道where也应该比having快点的，因为它过滤数据后才进行sum，所以having是最慢的。但也不是说having没用，因为有时在步骤3还没出来都不知道那个记录才符合要求时，就要用having了。

【自连接(self-joins)】
　　在某些状况下，可能需要比较来自同一个表的两组信息才能获得所需的结果。例如：
　　按业务员的销售额的高低顺序，显示每一个业务员的销售额，并伴随显示那些比他销售还多的业务员的平均销售额。
　　select a.salesman,a.name,a.ytdsales,AVG(b.ytdsales) as better ;
from salesman A,salesman B ; &&这里把salesman打开两次，分别起个别名A和B
where A.ytdsales＜B.ytdsales ;
grou by A.salesman ;
orde by A.ytdsales DESC

相同于使用联接：
　　select a.salesman,a.name,a.ytdsales,AVG(B.ytdsales) as better ;
from salesman inner join salesman salesman_a ;
on salesman.ytdsales＜salesman.ytdsales ;
grou by salesman.name ;
orde by salesman.dd desc

注：自连接时必须注意以下事项：
　　1、同一来源数据库务必给予不同的别名；
　　2、位于select命令语句的字段串列中各个字段前都必须中上别名；
　　3、由于一旦自连接后即形成“多对多”的关联性连接，因此请小心设定where参数的连接条件。在一个

　　有1千个记录的表中，执行第一条命令要188.261秒，第二条命令要154.712秒。而500个记录时，第一条命令6.870秒，第二条7.190秒。虽然其中的数值有点不是很准确，但这不重要，只要知道不要随便使用这种方法就行了。

下页8

打印本文

关闭窗口