转至繁体中文版     | 网站首页 | 图文教程 | 资源下载 | 站长博客 | 图片素材 | 武汉seo | 武汉网站优化 | 
最新公告:     敏韬网|教学资源学习资料永久免费分享站!  [mintao  2008年9月2日]        
您现在的位置: 学习笔记 >> 图文教程 >> 软件开发 >> VB.NET程序 >> 正文
XML 简单接口 (SAX2)用Visual Basic 实现的示例         ★★★★

XML 简单接口 (SAX2)用Visual Basic 实现的示例

作者:闵涛 文章来源:闵涛的学习笔记 点击数:2049 更新时间:2009/4/23 18:58:35

Martin Naughton
2000年6月

下载示例代码 下载本文的示例代码 (351 KB)

摘要:本文概述用 Microsoft Visual Basic 编制 SAX2 接口的方法。

简介

May 2000 MSXML Technology Preview 的关键功能之一是实现了 SAX2 (Simple API for XML, version 2)。MSDN XML 开发人员中心提供的题为 XML 开发人员的 SAX2 快速入门一文和可下载的 Microsoft® Visual C++® 应用程序,可作为 SAX2 的简介。在本文中,我将概述用 Visual Basic® 编制 SAX2 接口的方式。请注意,不对本示例提供技术支持,本示例的目的仅是帮助您建立 SAX/Visual Basic 解决方案的原型。此外,应该清楚的是本例中的接口不会对 Microsoft Visual Basic 将来对 SAX 的支持产生影响。

世界,你好!

在有了 Visual Basic (VB) 后,使用组件对象模型 (COM) 组件(例如 MSXML3.dll)的典型方式是创建新的标准 EXE 工程,然后进入工程/引用菜单,添加对 MSXML3.dll 类型库(Microsoft XML,版本 3.0)的引用。此时可以用 Visual Basic 对象浏览器来查看所选接口的属性、方法和事件。

我是用 MSXML3.dll 完成这些任务的,然后徒劳地查找 SAX2 接口,但是在该类型库中没有找到任何远程 SAX-y。然后我查看了注册表以确定是否安装了正确的 MSXML3.dll 版本。当然是这样的,在 HKEY_CLASSES_ROOT 目录下还有两个很有可能的 ProgIDs(特别是 Msxml2.SAXXMLReader 和 Msxml2.SAXXMLReader.3.0),所以我连续在新闻组中询问了类似于“我丢失了什么东西吗?”的问题。很快就有答复指出我实际上丢失了一些东西。

使用来源,Luke

SAX2 接口是在称为 Xmlsax.idl 的文件中定义的。如果将 MSXML3.dll 安装到默认文件夹中,则可以在称为 C:\Program Files\Microsoft XML Parser SDK\inc 的文件夹中找到 Xmlsax.idl。在找到该文件后,我将 Xmlsax.idl 编译到称为(非常合适的)Xmlsax.tlb 的类型库中。MIDL IDL 是我用来进行编译的工具。

回到 Visual Basic 集成开发环境 (IDE) 中,我返回到工程/引用菜单,这次我从引用对话框中选择了浏览以便找到新的 Xmlsax.tlb 文件。用这种方法选择类型库的结果,VB IDE 首先注册了类型库文件。这就振奋多了。现在 SAX2 接口可以显示在“对象浏览器”中了。

字符构造材料

对某些方法参数的检查证实了新闻组的答复对我的建议:接口对 Visual Basic 有一点不友好。请记住,Microsoft XML SDK 3.0 中的文档将 SAX2 接口描述为“Microsoft 的 SAX2 的 COM/C++ 实现”。总而言之,在 Visual Basic 开发人员期望看到一个字符串参数的地方实际上是两个参数。这些参数的第一个有“pwch”匈牙利前缀(“到通配符数组的指针”?),第二个有“cch”前缀(“字符计数”?)。

下面是 StartElement 方法的 ISAXContentHandler IDL 的样子:

HRESULT StartElement(
        [in] const wchar_t * pwchNamespaceUri, 
        [in] int cchNamespaceUri, 
        [in] const wchar_t * pwchLocalName, 
        [in] int cchLocalName, 
        [in] const wchar_t * pwchQName, 
        [in] int cchQName, 
        [in] ISAXAttributes * pAttributes);

好在新闻组的答复提供了一段处理这些参数的 Visual Basic 代码。该函数的简化版本如下。

Public Function UnicodeArrayToString(pwchArray As Integer, ByVal lCharCount As Long) As String

Dim sText As String

'''' 调整字符串大小为正确的字符数
sText = String$(lCharCount, 0)

'''' 复制这些值。请注意大小是字符数的两倍,
’因为字符串是 Unicode(双字节)
Call CopyMemory(ByVal StrPtr(sText), iUnicodeCharArrayFirstElt, 
  lCharCount * 2)

UnicodeArrayToString = sText

End Function

XMLSAX 接口返回 Visual Basic 整型数组,加上数组中的项目数。UnicodeArrayToString 函数使用未公开的 Visual Basic StrPtr 函数,加上对 CopyMemory Windows API 的调用,以便将这些值转换为 Visual Basic 字符串。CopyMemory 是 Windows API RtlMoveMemory 的别名。

用于 Visual Basic 的 SAX2“快速入门”

我们现在可以开始在 Visual Basic 中编写“SAX2 快速入门”的版本了。为了获得类似于 C++“快速入门”应用程序的结果,请使用下面的指令。注意不需要对 MSXML 的引用。

  1. 创建 Visual Basic 标准 EXE 工程。

  2. 添加对 XMLSAX.tlb 文件的引用(包括在下载中)。

  3. 将下面的代码复制和粘贴到 Visual Basic Form 代码窗口中(在粘贴代码后,在运行之前需要从代码中删除回车符)。

  4. 在窗体中添加 CommandButton (Command1)

  5. 保存该工程。

  6. 如果它还没有存在,请将名为 Test.xml 的正确 XML 文件放在保存工程的文件夹中。

  7. 在“调试”模式下运行工程。

  8. 单击 Command1 按钮。

  9. 观察 Immediate 窗口。
Option Explicit

Private Declare Sub CopyMemory Lib "kernel32" Alias "RtlMoveMemory" (pDest
  As Any, pSource As Any, ByVal ByteLen As Long)

Implements XMLSAX.ISAXContentHandler

Private Sub Command1_Click()

Call Parse

End Sub

Private Function Parse() As Boolean

Dim i() As Integer
Dim str As String

Dim sax As SAXXMLReader30

Set sax = New SAXXMLReader30

Call sax.PutContentHandler(Me)

str = App.Path & "\" & "test.xml"

'''' 调整数组大小为字符的数目
ReDim i(Len(str))

'''' 复制内存,注意其大小是字符数的两倍,
'''' 因为它是 unicode(双字节)字符串 
CopyMemory i(0), ByVal StrPtr(str), Len(str) * 2

'''' 忽略下面中的第一个矩阵项
sax.ParseURL i(0), Len(str)

End Function

Private Sub ISAXContentHandler_Characters(pwchChars As Integer, ByVal
  cchChars As Long)

''''什么也不做

End Sub

Private Sub ISAXContentHandler_EndDocument()

''''什么也不做


End Sub

Private Sub ISAXContentHandler_EndElement(pwchNamespaceUri As Integer,
  ByVal cchNamespaceUri As Long, pwchLocalName As Integer, ByVal
  cchLocalName As Long, pwchQName As Integer, ByVal cchQName As Long)

''''什么也不做

End Sub

Private Sub ISAXContentHandler_EndPrefixMapping(pwchPrefix As Integer,
  ByVal cchPrefix As Long)

''''什么也不做


End Sub

Private Sub ISAXContentHandler_IgnorableWhitespace(pwchChars As Integer,
  ByVal cchChars As Long)

''''什么也不做


End Sub

Private Sub ISAXContentHandler_ProcessingInstruction(pwchTarget As
  Integer, ByVal cchTarget As Long, pwchData As Integer, ByVal cchData
  As Long)

''''什么也不做


End Sub

Private Sub ISAXContentHandler_PutDocumentLocator(ByVal pLocator As
  XMLSAX.ISAXLocator)

''''什么也不做

End Sub

Private Sub ISAXContentHandler_SkippedEntity(pwchName As Integer, ByVal
  cchName As Long)

''''什么也不做


End Sub

Private Sub ISAXContentHandler_StartDocument()

End Sub

Private Sub ISAXContentHandler_StartElement(pwchNamespaceUri As Integer,
  ByVal cchNamespaceUri As Long, pwchLocalName As Integer, ByVal
  cchLocalName As Long, pwchQName As Integer, ByVal cchQName As Long,
  ByVal pAttributes As XMLSAX.ISAXAttributes)

Dim str As String

'''' 调整字符串大小为正确的字符数
str = String$(cchLocalName, 0)

'''' 复制这些值。请注意大小是字符数的两倍,
'''' 因为它是 unicode(双字节)字符串
CopyMemory ByVal StrPtr(str), pwchLocalName, cchLocalName * 2

Debug.Print str

End Sub

Private Sub ISAXContentHandler_StartPrefixMapping(pwchPrefix As Integer,
  ByVal cchPrefix As Long, pwchUri As Integer, ByVal cchUri As Long)

''''什么也不做


End Sub

将它包装起来

在克服了用 Visual Basic 编写 SAX2 程序的最初困难后,我决定,最好长期封装所有 Visual Basic 內部 SAX2 介面包装类別中棘手的要素。

工作结果可以在本文的下载地点看到。它虽不完整,但是演示了所有要点。该示例代码可以编译为 ActiveX® 组件 (VBXMLSAX),然后重复使用(在 Visual Basic、VBScript、JScript® 或者甚至 Visual C++ 中),并不需知道实现的细节。对那些希望了解某些实现问题的人来说,请阅读它们。

停止分析器,我想离开!

基于事件的分析器(如 SAX2)的强大功能之一,是能在与用户定义条件匹配时停止分析。例如,您可能希望在 XML 文档中遇到称为“UNINTERESTING”的元素时停止分析。SAX2 处理程序接口允许用户停止分析。我们尝试将处理程序接口上的方法表示为自己的包装程序类中的 Visual Basic 事件,使得事件接收方(例如 VB 窗体对象)可以控制分析的终止。

对接口的处理程序家族文档的观察告诉我们,处理程序方法通过将返回值 (HRESULT) 设置为 ERR_FAIL 符号值,来表示需要停止分析。只有一个问题:VB 隐藏了 HRESULT,因此无法在自定义处理程序代码中设置该值。

实际上是可以设置该值的,但是必须跳过某些环节。该技术称为“vtable 修改”,并被描述在 Bruce McKinney 的书 Hardcore Visual Basic 中。在运行时,有可能将调用重新定向,从 Visual Basic 所提供事件处理程序定向为用户自己的函数。该技术的关键是使用 AddressOf 操作符来获得重载的函数地址,然后使用 CopyMemory 来覆盖相应接口的 vtable 项。由于重载函数是由用户(不是 Visual Basic)定义的,因此返回值是可控制的。

让我们来看一个示例。ISAXContentHandler 接口提供称为 StartDocument 的方法。如果我们创建实现 ISAXContentHandler (CVBSAXContentHandler) 的 Visual Basic 类包装程序,那么 Visual Basic 将提供与下面类似的处理程序原型:

Private Sub ISAXContentHandler_StartDocument()

在后面的函数原型实际上是:

Public Function ISAXContentHandler_StartDocument(ByVal This As
  ISAXContentHandler) As Long

实际上返回类型是 HRESULT,但是可以使用 Visual Basic Long 数据类型来存储 HRESULT 值。因此,为了重载 StartDocument 方法,我们用 BAS 文件中的后一种原型创建了函数。在运行时调用的是这个重载函数而不是 Visual Basic 类包装程序中的程序。请注意增加的参数 This。它是所调用的 ISAXContentHandler 处理程序的实例。下面是 StartDocument 的重载函数:

Public Function ISAXContentHandler_StartDocument(ByVal This As ISAXContentHandler) As Long
  
#If iDebug = -1 Then
  Debug.Print "VTable Replacement for ISAXContentHandler_StartDocument"
#End If
  
  Dim booAbort As Boolean

  Dim objVBSAXContentHandler As CVBSAXContentHandler
  Set objVBSAXContentHandler = This
  
  Call objVBSAXContentHandler.StartDocument(booAbort)
  
  If booAbort Then
    ISAXContentHandler_StartDocument = E_FAIL
  Else
    ISAXContentHandler_StartDocument = S_OK
  End If

End Function

使用该技术有一个问题。AddressOf 操作符只能用于在标准模块(BAS 文件)中定义的函数。因此,同样的函数将在特定处理程序接口的所有实例上调用。这样就提出一个问题,如何确定被调用的处理程序包装程序的实例(因为它是触发该事件的包装程序)。

好在 vtable 重载函数需要的格式包含 This 参数(参见前面的代码示例),它的类型就是被调用的接口。通过该参数,我们可以声明类型为 CVBSAXContentHandler 的变量,来执行与 QueryInterface 等价的功能,然后进行下面的赋值。

Dim objCVBSAXContentHandler As CVBSAXContentHandler
Set objCVBSAXContentHandler = This

调用有效地获得了 Visual Basic 包装程序接口。然后我们可以调用包装程序,然后就可以按预期的方式触发事件了。

为了达到这种效果,我们在 CVBSAXContentHandler 上按“Friend”范围定义了的方法。用这种方法,VBSAXXML 组件的内部代码可以访问函数,但是外部客户机甚至无法看到它。该 Friend 方法的实现仅仅触发事件、传送所有原始参数,加上 Abort 标志(用 ByRef 传送),因此处理该事件的代码可以设置标志。下面是代码:

Friend Sub StartDocument(Abort As Boolean)
 
  RaiseEvent StartDocument(Abort)

End Sub

在从客户机应用程序(例如窗体)的 StartDocument 事件处理程序返回后,CVBSAXContentHandler 中的 Friend StartDocument 方法简单地将 Abort 参数的值传回 vtable 重载函数。根据 Abort 标志的值,vtable 重载可以正确地设置底层 ISAXContentHandler.StartElement 方法的 HRESULT 返回值。

其他处理程序方法也可以按类似的方式重载。下面是重载 StartElement 方法的函数原型,它有自己的参数。

Public Function ISAXContentHandler_StartElement(ByVal This As
  ISAXContentHandler, pwchNamespaceUri As Integer, ByVal cchNamespaceUri
  As Long, pwchLocalName As Integer, ByVal cchLocalName As Long, pwchQName
  As Integer, ByVal cchQName As Long, ByVal pAttributes As
  XMLSAX.ISAXAttributes) As Long

Friend 等价物类似于:

Friend Sub StartElement(ByVal NamespaceUri As String, ByVal LocalName As
  String, ByVal QName As String, ByVal Attributes As CVBSAXAttributes,
  Abort As Boolean)
  
  RaiseEvent StartElement(NamespaceUri, LocalName, QName, Attributes,
  Abort)

End Sub

在此函数有自己的函数,它是将 C++ 风格参数映射为 Visual Basic 友好字符串的 vtable 重载函数。

类型库 Hacking

在某些情况下可以发现,编译提供的 Xmlsax.idl 文件产生的 Xmlsax.tlb 类型库,不仅仅是对 Visual Basic 不友好,而且实际上在 Visual Basic 中不能用。特别是在 IDL 中定义为 [out] 的方法的参数,对 Visual Basic 来说是不可接受的。如果参数定义为 [in, out](ByRef

[1] [2]  下一页


[Web开发]XML与HTML在语法上的主要区别详解  [系统软件]如何让Expat支持中文XML
[VB.NET程序]vb.net 与 XML 的操作  [VB.NET程序]vb.net读写xml(2)--实现datagrid与xml的沟通(原创…
[VB.NET程序]vb.net 读写xml方法(1)  [VB.NET程序][VB.NET+XML]完成简单程序配置
[VB.NET程序]Visual Basic 6 逆向工程与反逆向工程 (2)  [VB.NET程序]Visual Basic 6 逆向工程与反逆向工程 (1)
[VB.NET程序]用Visual Basic创建复杂窗体  [VB.NET程序]Visual Basic的类对于面向对象的支持
教程录入:mintao    责任编辑:mintao 
  • 上一篇教程:

  • 下一篇教程:
  • 【字体: 】【发表评论】【加入收藏】【告诉好友】【打印此文】【关闭窗口
      注:本站部分文章源于互联网,版权归原作者所有!如有侵权,请原作者与本站联系,本站将立即删除! 本站文章除特别注明外均可转载,但需注明出处! [MinTao学以致用网]
      网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)

    同类栏目
    · C语言系列  · VB.NET程序
    · JAVA开发  · Delphi程序
    · 脚本语言
    更多内容
    热门推荐 更多内容
  • 没有教程
  • 赞助链接
    更多内容
    闵涛博文 更多关于武汉SEO的内容
    500 - 内部服务器错误。

    500 - 内部服务器错误。

    您查找的资源存在问题,因而无法显示。

    | 设为首页 |加入收藏 | 联系站长 | 友情链接 | 版权申明 | 广告服务
    MinTao学以致用网

    Copyright @ 2007-2012 敏韬网(敏而好学,文韬武略--MinTao.Net)(学习笔记) Inc All Rights Reserved.
    闵涛 投放广告、内容合作请Q我! E_mail:admin@mintao.net(欢迎提供学习资源)

    站长:MinTao ICP备案号:鄂ICP备11006601号-18

    闵涛站盟:医药大全-武穴网A打造BCD……
    咸宁网络警察报警平台