Go语言之城 - 程序示例: 正则表达式

Go 提供了内建的正则表达式支持。 这儿有一些在 Go 中与 regexp 相关的常见用法示例。

package main
import (
    "bytes"
    "fmt"
    "regexp"
)
func main() {

测试一个字符串是否符合一个表达式。

    match, _ := regexp.MatchString("p([a-z]+)ch", "peach")
    fmt.Println(match)

上面我们是直接使用字符串,但是对于一些其他的正则任务, 你需要通过 Compile 得到一个优化过的 Regexp 结构体。

    r, _ := regexp.Compile("p([a-z]+)ch")

该结构体有很多方法。这是一个类似于我们前面看到的匹配测试。

    fmt.Println(r.MatchString("peach"))

查找匹配的字符串。

    fmt.Println(r.FindString("peach punch"))

这个也是查找首次匹配的字符串, 但是它的返回值是,匹配开始和结束位置的索引,而不是匹配的内容。

    fmt.Println("idx:", r.FindStringIndex("peach punch"))

Submatch 返回完全匹配和局部匹配的字符串。 例如,这里会返回匹配 p([a-z]+)ch([a-z]+) 的信息。

    fmt.Println(r.FindStringSubmatch("peach punch"))

类似的,这个会返回完全匹配和局部匹配位置的索引。

    fmt.Println(r.FindStringSubmatchIndex("peach punch"))

All 的这些函数返回全部的匹配项, 而不仅仅是首次匹配项。例如查找匹配表达式全部的项。

    fmt.Println(r.FindAllString("peach punch pinch", -1))

All 同样可以对应到上面的所有函数。

    fmt.Println("all:", r.FindAllStringSubmatchIndex(
        "peach punch pinch", -1))

这些函数接收一个非负整数作为第二个参数,来限制匹配次数。

    fmt.Println(r.FindAllString("peach punch pinch", 2))

上面的例子中,我们使用了字符串作为参数, 并使用了 MatchString 之类的方法。 我们也可以将 String 从函数名中去掉,并提供 []byte 的参数。

    fmt.Println(r.Match([]byte("peach")))

创建正则表达式的全局变量时,可以使用 Compile 的变体 MustCompileMustCompilepanic 代替返回一个错误 ,这样使用全局变量更加安全。

    r = regexp.MustCompile("p([a-z]+)ch")
    fmt.Println("regexp:", r)

regexp 包也可以用来将子字符串替换为为其它值。

    fmt.Println(r.ReplaceAllString("a peach", "<fruit>"))

Func 变体允许您使用给定的函数来转换匹配的文本。

    in := []byte("a peach")
    out := r.ReplaceAllFunc(in, bytes.ToUpper)
    fmt.Println(string(out))
}
$ go run regular-expressions.go 
true
true
peach
idx: [0 5]
[peach ea]
[0 5 1 3]
[peach punch pinch]
all: [[0 5 1 3] [6 11 7 9] [12 17 13 15]]
[peach punch]
true
regexp: p([a-z]+)ch
a <fruit>
a PEACH

有关 Go 正则表达式的说明,请参考 regexp 包文档。

下一个例子: JSON