string转byte类型 字符串转byte数组( 二 )


我们通过go对二进制转为整型:
fmt.Printf("%d, %dn", 0b11000010, 0b10000001)// 输出:194, 129复制代码综上:当用字符转字节时输出的是字符本身的整型值,当用字符串转字节切片时,实际上是输出的是utf8的字节切片序列(go中的字符串存储的就是utf8字节切片) 。此时,我们回顾一下最开始的问题,就会发现输出是完全符合预期的 。
go中的rune笔者在这里猜测提问者期望的结果是“字符串转字节切片和字符转字节的结果保持一致”,这时rune就派上用场了,我们看看使用rune的效果:
fmt.Println([]rune("?"))// 输出:[129]复制代码由上可知用rune切片去转字符串时,它是直接将每个字符转为对应的unicode 。
我们通过下面的代码模拟字符串转为[]rune切片和[]rune切片转为字符串的过程:
字符串转为rune切片:
// 字符串直接转为[]rune切片for _, v := range []rune("新世界杂货铺") {fmt.Printf("%x ", v)}fmt.Println()bs := []byte("新世界杂货铺")for len(bs) > 0 {r, w := utf8.DecodeRune(bs)fmt.Printf("%x ", r)bs = bs[w:]}fmt.Println()// 输出:// 65b0 4e16 754c 6742 8d27 94fa// 65b0 4e16 754c 6742 8d27 94fa复制代码上述代码中utf8.DecodeRune的作用是通过传入的utf8字节序列转为一个rune即unicode 。
rune切片转为字符串:
// rune切片转为字符串rs := []rune{0x65b0, 0x4e16, 0x754c, 0x6742, 0x8d27, 0x94fa}fmt.Println(string(rs))utf8bs := make([]byte, 0)for _, r := range rs {bs := make([]byte, 4)w := utf8.EncodeRune(bs, r)utf8bs = append(utf8bs, bs[:w]...)}fmt.Println(string(utf8bs))// 输出:// 新世界杂货铺// 新世界杂货铺复制代码上述代码中utf8.EncodeRune的作用是将一个rune转为utf8字节序列 。
综上:对于无法确定字符串中仅有单字节的字符的情况, 请使用rune,每一个rune类型代表一个unicode字符,并且它可以和字符串做无缝切换 。
理解go中的字符串其实是字节切片前面已经提到了字符串能够存储任意字节数据,而且是一个标准的utf8格式的字节切片 。那么本节将会通过代码来加深印象 。
fmt.Println([]byte("新世界杂货铺"))s := "新世界杂货铺"for i := 0; i < len(s); i++ {fmt.Print(s[i], " ")}fmt.Println()// 输出:// [230 150 176 228 184 150 231 149 140 230 157 130 232 180 167 233 147 186]// 230 150 176 228 184 150 231 149 140 230 157 130 232 180 167 233 147 186复制代码由上述的代码可知,我们通过游标按字节访问字符串得到的结果和字符串转为字节切片是一样的,因此可以再次确认字符串和字节切片是等价的 。
通常情况下我们的字符串都是标准utf8格式的字节切片,但这并不是说明字符串只能存储utf8格式的字节切片,go中的字符串可以存储任意的字节数据 。
bs := []byte{65, 73, 230, 150, 176, 255}fmt.Println(string(bs))// 将随机的字节切片转为字符串fmt.Println([]byte(string(bs))) // 将字符串再次转回字节切片rs := []rune(string(bs)) // 将字符串转为字节rune切片fmt.Println(rs)// 输出rune切片fmt.Println(string(rs))// 将rune切片转为字符串for len(bs) > 0 {r, w := utf8.DecodeRune(bs)fmt.Printf("%d: 0x%x ", r, r) // 输出rune的值和其对应的16进制bs = bs[w:]}fmt.Println()fmt.Println([]byte(string(rs))) // 将rune切片转为字符串后再次转为字节切片// 输出:// AI新?// [65 73 230 150 176 255]// [65 73 26032 65533]// AI新?// 65: 0x41 73: 0x49 26032: 0x65b0 65533: 0xfffd// [65 73 230 150 176 239 191 189]复制代码仔细阅读上面的代码和输出,前5行的输出应该是没有疑问的 。但是第6行输出却和预期有出入 。
前面提到了字符串可以存储任意的字节数据,那如果存储的字节数据不是标准的utf8字节切片就会出现上面的问题 。
我们已经知道通过utf8.DecodeRune可以将字节切片转为rune 。那如果碰到不符合utf8编码规范的字节切片时,utf8.DecodeRune会返回一个容错的unicodeuFFFD,这个unicode对应上面输出的16进制0xfffd 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: