打印本文 打印本文 关闭窗口 关闭窗口
确定包含全角和半角字符的字符串长度(VB)
作者:武汉SEO闵涛  文章来源:敏韬网  点击数665  更新时间:2009/4/23 15:04:00  文章录入:mintao  责任编辑:mintao

确定包含全角和半角字符的字符串长度(VB)

         各个版本的VB对汉字字符的长度定义并不相同。在Windows 3.x中,VB3中认为每个汉字的长度为2字节。VB自从32位版本以後,不管中英文字,均以2 bytes来储存,这与中文Win95的汉字内核有关。但是VB4以后,VB认为每个汉字的长度为1。这在处理包含汉字的字符串时带来很多的不便。

  由于Len、Left、Mid等字符串函数认为一个汉字和一个西文字符的长度都为1,因此处理汉字字符串时有一定的难度。实现上必须要能把汉字按照两个字符(字节)的形式读出。因此在截取汉字字符串的子串时需特别注意。

  由于汉字处理和汉字字模存储的特殊性,在许多情况下我们希望汉字字符的长度为2,英文字符为1。由于VB5和VB6把一个汉字作为一个字符。因此处理汉字时首先必须能正确判断汉字字符串的长度。

  在VB3或C++里,汉字的 ASCII码均大于零,而VB5和VB6中汉字的ASCII码小于0。因此通过判断一个未知字符的ASCII码就可以判断该字符是否汉字。

  这里我们提供了两种方法来判断汉字字符串的长度。

  1、方法1

  VB6中提供了LenB函数用于字符串中的字节数据。如同在双字节字符集(DBCS)语言中一样,LenB返回的是用于代表字符串的字节数,而不是返回字符串中字符的数量。如为用户自定义类型,LenB返回在内存中的大小。

  LenB(StrConv(Str1,vbFormUnicode))

  对要处理的字符串Str1,必须先使用StrConv函数把ANSI格式的Byte数组转换为字符串,否则直接使用LenB函数得到的结果比实际结果大。

  2、方法2

  这里自定义了一个子函数CLen来计算汉字字符串的实际长度。同时还能判断字符串中汉字的实际个数。

  Function CharacterLen(s_str As String) As Integer

            Dim i_num As Integer
            Dim i_index As Integer
            Dim i_len As Integer
   
            i_len = Len(s_str)

            For i_index = 1 To i_len
    
                If Asc(Mid(s_str, i_index, 1)) < 0 Then
                    i_num = i_num + 1
                End If

            Next

            CharacterLen = i_len + i_num

    End Function


 CharacterLen函数中的静态变量HzNum返回字符串中实际汉字的数目。

打印本文 打印本文 关闭窗口 关闭窗口