|
剖析 ADO.NET 批处理更新(深入研究数据访问)
发布日期: 4/1/2004 | 更新日期: 4/1/2004
Dino Esposito
Wintellect
2001 年 11 月 8 日
ADO.NET 应用程序和基础数据源之间的交互基于一个具有双向信道的双体系结构。您可以使用各个特定于提供程序的命令或批处理更新过程来访问数据源,以读取和写入行。在这两种情况下,数据访问都会产生完全双向绑定,并涉及各种不同的对象和方法。您可以使用如 SqlCommand 和 OleDbCommand 等命令类来执行单个命令。可使用数据适配器对象来下载断开连接的数据,提交更新的行集。虽然 “数据集” 是数据适配器用于返回和提交记录块的容器对象,但各个命令通过数据读取器对象返回数据。
更新是通过各个命令、存储过程完成的,通常,托管提供程序理解的任何命令文本一般都被称为更新。更新命令总是执行嵌入在语句正文中的新数据。更新命令总是需要一个打开的连接,可能还需要一个正在进行的事务处理或一个新的事务处理。批处理更新则是一个略有不同的方法分支。从最高的抽象级别来看,您并不发出命令,无论它可能有多么复杂。取而代之的是,您提交在客户端修改的当前行的快照,并等待数据源批准。批处理更新背后的关键概念是数据断开连接的概念。您下载行表,通常为数据集,根据需要在客户端对它进行修改,然后将这些行的新映像提交到数据库服务器。您所作的是提交更改,而不是执行一个对数据源创建更改的命令。这就是更新(我在 July column 一文中讨论过这个问题)和批处理更新之间的本质区别。
下图说明了 ADO.NET 的双更新体系结构。

图 1. ADO.NET 应用程序和数据源之间的两个双向交互
在进一步详细讨论 ADO.NET 批处理更新之前,我需要阐明常常会导致某种误解的批处理更新模型的一个方面。虽然更新和批处理更新在 ADO.NET 内的实际实现方面有着本质的区别,但它们遵循的是同一个更新模型。更新和批处理更新都是通过直接的并且特定于提供程序的语句来完成的。当然,由于批处理更新通常涉及到更多的行,所以这些语句会被组合为一个批处理调用。批处理更新会对目标数据集的行进行从头到尾的循环,只要发现更新的行,就会发出适当的更新命令(INSERT、DELETE 或 UPDATE)。对更新的行进行通信时,将运行一个预定义的直接 SQL 命令。从本质上来说,这就是批处理更新。
这个过程是理所当然的。实际上,如果批处理更新使用完全不同的更新模型,就需要来自数据源的特殊支持。(这正是向 SQL Server 2000 提交 XML updategram 时发生的情况。)批处理更新只是一个用来简化多个行更新提交的客户端提供的软件机制。在任何情况下,每个新行提交总是通过数据源直接命令的正常通道完成的。
到目前为止,本文只提及了 SQL 命令,但这些提及的内容都明确表明了 ADO 批处理更新实现和 ADO.NET 批处理更新实现之间的一个重要区别。在 ADO 中,批处理更新只可能发生在基于 SQL 的数据源上。而在 ADO.NET 中,批处理更新则可能发生在任何种类的托管提供程序上,其中包括那些不应该通过 SQL 查询语言公开其数据的托管提供程序。现在,我们可以开始讨论 ADO.NET 批处理更新编程的关键内容了。
准备用于提交的数据集
ADO.NET 批处理更新通过数据适配器对象的 “更新” 方法进行。数据只能以每个表为基础进行提交。如果您调用 “更新” 时没有指定表名,则使用 Table 这个默认的表名。如果不存在具有该名称的表,则会产生异常。“更新” 首先检查每个表行的 RowState 属性,然后为所指定表中的每个插入行、更新行或删除行准备自定义的 INSERT、UPDATE 或 DELETE 语句。
“更新” 方法有几个超载。它可以采用数据集和数据表提供的对、某个数据表、甚至是一个 DataRow 对象数组。该方法会返回一个整数值,即成功更新的行数。
为了最大限度地减少网络通信,通常会对正在操作的数据集的一个子集调用 “更新”。毫无疑问,这个子集只包含当时已修改的行。您可以通过调用数据集的 GetChanges 方法来获得这样的子集。 if (ds.HasChanges())
{
DataSet dsChanges = ds.GetChanges();
adapter.Update(dsChanges, "MyTable");
}
另外,您可以使用 HasChanges 方法检查数据集是否发生了更改。HasChanges 返回一个布尔值。
GetChanges 返回的数据集包含当时已插入、删除或修改的行。但这里所说的当时是什么时间呢?这正是 ADO.NET 批处理更新比较复杂的一个方面,必须与表行的当前状态一起处理。
返回页首
行的状态
“数据表” 中的每一行都是通过 DataRow 对象呈现的。DataRow 对象主要是作为父 “数据表” 对象的 Rows 集合的一个元素而存在的。从概念上来看,数据库行固有地链接到了某个给定表的结构。就是由于这个原因,ADO.NET 中的 DataRow 类不提供公用构造函数。创建新 DataRow 对象的唯一方式是借助于对 “数据表” 对象的某个实时实例调用名为 NewRow 的方法。刚刚创建好的行还不属于父表的 Rows 集合,但该行与此集合的关系决定了该行的状态。下表显示了 RowState 属性的一些可取值。这些值组合在了 DataRowState 枚举中。
Added
该行已添加到表中。
Deleted
该行已标记为从父表删除。
Detached
该行已创建但尚未添加到表中,或者该行已从表行的集合中删除。
Modified
该行中的某些列已更改。
Added
该行已添加到表中。
Unchanged
在创建后或上次调用 AcceptChanges 方法后未对该行进行任何更改。
每一行的 RowState 属性都会影响 HasChanges 方法的返回值以及 GetChanges 返回的子数据集的内容。
从这些可取值的范围可以看出,RowState 的值主要取决于对行已经执行的操作。ADO.NET 表基于两个方法 - AcceptChanges 和 RejectChanges - 来实现类似事务处理的提交模型。从数据源下载表时或在内存中新建表时,所有行都是没有更改的。您输入的所有更改不会立即变为永久性更改,随时都可以通过调用 RejectChanges 来回滚更改。您可以在三个级别调用 RejectChanges 方法:
•
在数据集级别上可拒绝所有更改(无论是什么更改)。
•
在数据表级别上可取消某个表中的所有更改。
•
在某个特定的行级别上可还原到该行以前的状态。
方法 AcceptChanges 能够提交所有正在进行的更改。它使得数据集会将当前值接受为新的原始值。因此,所有挂起的更改都被清除。与 RejectChanges 一样,也可以对整个数据集、某个表或某个行调用 AcceptChanges。
当您开始一个批处理更新操作时,只会考虑提交那些标记为 Added、Deleted 和 Modified 的行。如果您恰好在批处理更新之前调用了 AcceptChanges,则对数据源不进行任何持久更改。
另一方面,一旦批处理更新操作成功完成,您必须调用 AcceptChanges 来清除挂起的更改,并将当前数据集值标记为原始值。注意,如果省略了最后对 AcceptChanges 的调用,数据集中则会保留挂起的更改,从而导致在下次进行批处理更新时重新发出这些更改。 // Get changes in the DataSet
dsChanges = ds.GetChanges();
// Performs the batch update for the given table
da.Update(dsChanges, strTable);
// Clears any pending change in memory
ds.AcceptChanges();
上面的代码说明了 ADO.NET 批处理更新背后的三个主要步骤。
如果从数据集表中删除行,请注意您使用的方法是 “删除” 还是 “移除”。“删除” 方法会通过将行标记为 “删除”,执行逻辑删除。而 “移除” 方法则从 Rows 集合中物理删除该行。因此,通过 “移除” 删除的行不会标记为删除,因此在后面的批处理更新期间也不会被处理。如果您的最终删除目标是从数据源删除行,则应使用 “删除”。
返回页首
更新的深入内容
有三个操作可改变表的状态:
•
插入一个新行
•
删除一个现有的行
•
更新一个现有的行
对于其中的每一个关键操作,数据适配器都会定义一个作为属性公开的自定义的命令对象。这样的属性包括 InsertCommand、DeleteCommand 和 UpdateCommand。程序员负责为这些属性分配有意义的命令对象,例如,SqlCommand 对象。
仅提供的 InsertCommand、DeleteCommand 和 UpdateCommand 属性就代表了从 ADO 到 ADO.NET 的巨大突破。利用这种属性,您可以对内存中的更新提交到数据库服务器的方式进行前所未有的控制。如果您不满意 ADO.NET 生成的更新代码,现在则可以修改这些更新代码,而不会否定批处理更新的整体特性。使用 ADO 的时候,您对库静默生成的 SQL 命令毫无控制权。而在 ADO.NET 中,利用公开显示的命令对象,您可以使用更符合用户期望的自定义存储过程或 SQL 语句来应用更新。特别是,您可以对交叉引用的表使用批处理更新系统,甚至可以诸如 Active Directory™ 或 Indexing Services 这样的非 SQL 数据提供程序为目标。
更新命令应该针对表中每个更改的行运行,并且必须非常通用,以适应不同的值。对于这种任务,非常适合使用命令参数,只要您可以将它们绑定到数据库列的值。ADO.NET 参数对象公开两个用于这种绑定的属性,例如, SourceColumn 和 SourceVersion。尤其是 SourceColumn,它表示一种指示参数值的间接方式。您可以使用列名设置 SourceColumn 属性,并且使批处理更新机制不时地提取有效值,而不是使用 Value 属性并用标量值设置它。
SourceVersion 指示应该读取列上的哪个值。默认情况下,ADO.NET 会返回行的当前值。另一种方法是,您可以选择原始值和 DataRowVersion 枚举中的所有值。
如果您希望对 Northwind 的 Employees 表中的几个列进行批处理更新,可以使用以下自定义命令。INSERT 命令的定义如下: StringBuilder sb = new StringBuilder("");
sb.Append("INSERT Employees (firstname, lastname) VALUES(");
sb.Append("@sFirstName, @sLastName)");
da.InsertCommand = new SqlCommand();
da.InsertCommand.CommandText = sb.ToString();
da.InsertCommand.Connection = conn;
所有参数都将添加到数据适配器的 Parameters 集合并绑定到一个数据表列。 SqlParameter p1 = new SqlParameter("@sFirstName", SqlDbType.NVarChar, 10);
p1.SourceVersion = DataRowVersion.Current;
p1.SourceColumn = "firstname";
da.InsertCommand.Parameters.Add(p1);
SqlParameter p2 = new SqlParameter("@sLastName", SqlDbType.NVarChar, 30);
p2.SourceVersion = DataRowVersion.Current;
p2.SourceColumn = "lastname";
da.InsertCommand.Parameters.Add(p2);
注意,自动递增的列不应该列在 INSERT 命令的语法中,因为它们的值是由数据源生成的。
UPDATE 命令需要确定一个特定的行来应用其更改。为此,您可以使用 WHERE 子句,在该子句中对参数化的值与键字段进行比较。在这种情况下,WHERE 子句中使用的参数必须绑定到行的原始值,而不是当前值。 StringBuilder sb = new StringBuilder("");
sb.Append("UPDATE Employees SET ");
sb.Append("lastname=@sLastName, firstname=@sFirstName ");
sb.Append("WHERE employeeid=@nEmpID");
da.UpdateCommand = new SqlCommand();
da.UpdateCommand.CommandText = sb.ToString();
da.UpdateCommand.Connection = conn;
// p1 and p2 set as before
:
p3 = new SqlParameter("@nEmpID", SqlDbType.Int);
p3.SourceVersion = DataRowVersion.Original;
p3.SourceColumn = "employeeid";
da.UpdateCommand.Parameters.Add(p3);
最后,DELETE 命令需要用 WHERE 子句来确定要删除的行。在这种情况下,您需要使用行的原始版本来绑定参数值。 StringBuilder sb = new StringBuilder("");
sb.Append("DELETE FROM Employees ");
sb.Append("WHERE employeeid=@nEmpID");
da.DeleteCommand = new SqlCommand();
da.DeleteCommand.CommandText = sb.ToString();
da.DeleteCommand.Connection = conn;
p1 = new SqlParameter("@nEmpID", SqlDbType.Int);
p1.SourceVersion = DataRowVersion.Original;
p1.SourceColumn = "employeeid";
da.DeleteCommand.Parameters.Add(p1);
SQL 命令的实际结构取决于您。这些命令不一定是普通的 SQL 语句,它们可以是更有效的存储过程(如果您想采用这种方向)。如果存在某个很具体的风险 - 其他人可能更新您读取和修改的行,那么您可能想采取一些更有效的防范措施。如果是这种情况,您可以在 DELETE 和 UPDATE 命令中使用一个限制性更强的 WHERE 子句。WHERE 子句可以明确地确定行,但同时还应确保所有列仍然保留原始值。 UPDATE Employees
SET field1=@new_field1, field2=@new_field2, ???…, fieldn=@new_fieldn
WHERE field1=@old_field1 AND
field2=@old_field2 AND
:
fieldn=@old_fieldn
注意,您无需填充所有命令参数,只填充您计划使用的那些即可。如果代码要使用尚未指定的命令,则会引发异常。为批处理更新过程设置命令可能需要许多代码,但您无需在每一次进行批处理更新时都编写大量代码。实际上,在相当多的情况下,ADO.NET 都能为您自动生成有效的更新命令。
返回页首
命令生成器
要利用默认命令,必须满足两个要求。首先,必须为 SelectCommand 属性分配一个有效的命令对象。您无需填充其他命令对象,但 SelectCommand 必须指向一个有效的查询语句。用于批处理更新的有效查询是返回主键列的查询。另外,该查询不得包括 INNER JOIN、计算的列,也不得引用多个表。
SelectCommand 对象中列出的列和表实际上将用于准备更新和插入语句的正文。如果不设置 SelectCommand,则无法实现 ADO.NET 命令自动生成。下面的代码说明了如何为 SelectCommand 属性编写代码。 SqlCommand cmd = new SqlCommand();
cmd.CommandText = "SELECT employeeid, firstname, lastname FROM Employees";
cmd.Connection = conn;
da.SelectCommand = cmd;
不要担心 SelectCommand 可能对性能产生影响。相关的语句只在批处理更新过程之前执行一次,但它只检索列元数据。无论您怎样编写 SQL 语句,也永远不会向调用程序返回任何行。发生这种情况的原因是,在执行时,SelectCommand 追加到以下面的代码开头的 SQL 批处理语句最后 SET FMTONLY OFF
SET NO_BROWSETABLE ON
SET FMTONLY ON
因此,查询不返回行,而返回列元数据信息。
您的代码必须满足的第二个要求与命令生成器有关。命令生成器是一个特定于托管提供程序的类,它工作在数据适配器对象之上,并自动设置其 InsertCommand、DeleteCommand 和 UpdateCommand 属性。命令生成器首先运行 SelectCommand,以收集有关所涉及表和列的足够信息,然后会创建更新命令。实际的命令创建在命令生成器类构造函数中进行。 SqlCommandBuilder cb = new SqlCommandBuild[1] [2] 下一页 [C语言系列]NET 中C#的switch语句的语法 [操作系统]全面剖析Windows Server 2008开发指南 [系统软件]托拽Explore中的文件到VB.net的窗口 [系统软件]Boost库在XP+Visual C++.net中的安装 [常用软件]新配色面板:Paint.Net3.0RC1官方下载 [常用软件]用内建的“Net Meeting”聊天 [VB.NET程序]Henry的VB.NET之旅(三)—共享成员 [VB.NET程序]Henry的VB.NET之旅(二)—构造与析构 [VB.NET程序]Henry的VB.NET之旅(一)—失踪的窗体 [VB.NET程序]在托盘上显示Balloon Tooltip(VB.NET)
|