由于SIN函数计算比较耗CPU,也比较经典,故分别实现1千万次SIN运算做比较 sql2005代码: declare @i int; declare @x float; set @i=1; while @i<=10000000 begin set @x=sin(@i); set @i=@i+1; end; go 耗时:26秒 sas DATA步代码 : data _null_; length i x 8.; i=1; do i=1 to 10000000; x=sin(i); end; run; 运行结果: NOTE: “DATA 语句”所用时间(总处理时间): 实际时间 1.72 秒 CPU 时间 1.70 秒 耗时不到2秒 再对字符进行比较,我选择替换字符串做比较,也是分别实现1千万次进行字符串替换运算做比较 SQL代码 declare @i int; declare @str varchar(50); declare @tarStr varchar(50); set @i=1; set @str=''''This is my Test!''''; while @i<=10000000 begin set @tarStr=replace(@str,''''my'''',''''My''''); set @i=@i+1; end; print @tarStr; go 运行结果:耗时2分24秒 SAS DATA步代码 data _null_; length i 8.; length str tarstr $50.; str="This is my Test!"; i=1; do i=1 to 10000000; tarstr=tranwrd(str,"my","My"); end; put tarstr; run; 运行结果:耗时不到9秒 NOTE: DATA statement used (Total process time): real time 8.09 seconds cpu time 8.09 seconds 初步总结: 进行一千万次SIN运算时,SQL2005耗时26秒,SAS不到2秒,差不多相差13倍 进行一千万次字符替换运算时,SQL2005耗时144秒,SAS不到9秒,差不多相差16倍 可以看出,SAS的数据处理能力可以说是超强,在这方面可以说任何当前数据库都不能相比 如果不是由于SAS本身产品的限制,说不定早就在中国市场上流行了 :) 如果有人想把SAS做的ETL转为用SQL2005做ETL时,可要考虑客户的感受了,想想如果一下子由原来的十几天的数据加载变成几个月的数据加载,你就头疼把;当然如果只是小数据量加载之间的转换,还是没问题的 比较有意思的是,SAS的MERGE操作一直以来都是要求输入的数据要先按指定字段进行排序才能MERGE,现在SQL2005提供的MERGE组件也有了这样的要求,有点像终于找到党组织的感觉了
|