打印本文 打印本文 关闭窗口 关闭窗口
如何在Delphi中使用正则表达式
作者:武汉SEO闵涛  文章来源:敏韬网  点击数948  更新时间:2009/4/23 18:31:35  文章录入:mintao  责任编辑:mintao
    正则表达式最早是由数学家Stephen Kleene于1956年提出,他是在对自然语言的递增研究成果的基础上提出来的。具有完整语法的正则表达式使用  在字符的格式匹配方面上,后来被应用到熔融信息技术领域。
    正则表达式并非一门专用语言,但它可用于在一个文件或字符里查找和替代文本的一种标准。许多程序中都使用了正则表达式,但是作为我常用的编程工具之一的Delphi却没有直接提供对正则表达式的支持。郁闷之下,在网上进行了一番搜索研究之后,找到了以下几种在Delphi中使用正则表达式的方法。
    为了清楚的说明问题,我们以下面的例子来描述:
    已知网址:http://www.xcolor.cn/page1.htm
    求:链接中的文件名
    正确答案为:page1.htm

方法一 使用微软ScriptControl控件

    1. 编写一个脚本文件(test.vbs),里面包含要使用的正则表达式函数
function GetUrlFile(Url)
    Set RegObject = New RegExp     With RegObject
    .Pattern = "\w+\.\w+(?!.)"
    .IgnoreCase = True
    .Global = True
    End With     Set matchs =  RegObject.Execute(Url)     If matchs.Count > 0 Then
        For Each mach in matchs             GetUrlFile=mach.value
        Next
    End If     Set RegObject = nothing
end function

    2. 下载最新版的"Microsoft(r) Windows(r) Script"

    你可以在以下地址找到下载


    3 . 安装Microsoft(r) Windows(r) Script

    Visual Basic(r) Script Edition (VBScript.) Version 5.6,
    JScript(r) Version 5.6, Windows Script Components,
    Windows Script Host 5.6,
    Windows Script Runtime Version 5.6.将被安装到你的系统中

4 .在Delphi中导入MsScript.ocx ,生成TScriptControl控件

5.使用以下代码调用TScriptControl

procedure TForm1.Button2Click(Sender: TObject);
var
a: OleVariant;
begin

memo2.Lines.LoadFromFile(''''test.vbs'''');

ScriptControl1.Language := ''''Vbscript'''';
ScriptControl1.AddCode(string(memo2.Text));
a := VarArrayCreate([0, 0], varVariant);
a[0] := ''''http://www.xolor.cn/page1.htm'''';
memo1.Lines.Add(CallFunction(''''GetUrlFile'''', a));


end;

function TForm1.CallFunction(const FunctionName: string;
const Params: oleVariant): OleVariant;
var
Sarray: PSafeArray;
begin


try
// 转化为安全数组
Sarray := PSafeArray(TVarData(Params).VArray);
// 调用函数
Result := ScriptControl1.Run(FunctionName, Sarray);
except
on E: Exception do
begin
end;
end;

end;

  方法二 使用微软RegExp
    1. 下载并安装最新版的"Microsoft(r) Windows(r) Script"
    2. RegExp包含在vbscript.dll中所以我们必须先注册regsvr32 vbscript.dll

注(安装了Ie5后默认已经包含该控件)

    3.在Delphi中引入"Microsoft VBScript Regular Expressions"

主菜单->Project->Import type library->在列表中选择"Microsoft VBScript Regular Expressions"

生成TRegExp控件

    4.使用以下代码调用TRegExp控件

procedure TForm1.Button1Click(Sender: TObject);
var

machs: IMatchCollection;
Matchs: Match;
submatch: ISubMatches;
i, j: integer;
begin
RegExp1.Global := true;
RegExp1.Pattern := ''''\w+\.\w+(?!.)'''';
RegExp1.IgnoreCase := true;
machs := RegExp1.Execute(''''http://www.xcolor.cn/dd/page1.htm'''') as
IMatchCollection;
for i := 0 to machs.Count - 1 do
begin
Matchs := machs.Item[i] as Match;
submatch := Matchs.SubMatches as ISubMatches;
memo1.Lines.Add(matchs.Value);
//for j:=0 to submatch.Count -1 do
// memo1.Lines.Add(submatch.Item[j])
end;


end;

打印本文 打印本文 关闭窗口 关闭窗口