Sqlserver中:关于百万数据随机提取的问题-计算机等级三级考试网-优易学网

Sqlserver中:关于百万数据随机提取的问题

来源：优易学 2011-12-26 13:52:34 【优易学：中国教育考试门户网】资料下载 IT书店

　　这个问题来自论坛提问。很多人都知道类似下面的语句
　　select top 2000 * from tb order by newid()但是在海量数据下，它的性能是无法忍受的。这里我用一个变通的办法来实现性能的提升，思路为：表必须存在一个guid类型的主键或者索引列，然后用这个列去like一个随机字符串，随机字符串必须为guid规定的字符集合（数字+A到Z）。下面例子只用到了数字，并且只用了4个数字来匹配，你可以更改like后面的语句来调整这个策略。
　　--生成测试环境
　　use master
　　go
　　create table test(id uniqueidentifier,name varchar(100))
　　insert into test select newid(),name from syscolumns
　　--随机提取
　　select top 10 * from test where id like
　　char(48+abs(checksum(newid())%10))+　’%’+
　　char(48+abs(checksum(newid())%10))+　’%’+
　　char(48+abs(checksum(newid())%10))+　’%’+
　　char(48+abs(checksum(newid())%10))+’%’
　　--删除测试环境
　　drop table test我测试了300万数据提取2000条，耗时大约1秒左右。另外提醒一点，索引对like语句是有效的。

责任编辑：小草

上一个文章： SQLServer中如何使用javascript脚本验证数据
下一个文章：比较一下SQLServer约束和DML触发器

SQL冗余字段策略及管理
特殊字符ORA-01480错误的处理
三级数据库辅导:巧用AWK处理二进制数据文件
三级数据库:因有轮循故不停机
三级:电子商务中的数据挖掘技术
计算机三级:数据仓库设计的原则
利用SQLServer复制技术实现数据同步更新

热点资讯

资讯快报

热门课程培训

论坛新帖