mysql插入数据出现’\xF0\x9F\x8F’如何处理

mysql插入数据出现’\xF0\x9F\x8F’如何处理

问题
Incorrect string value: ‘\xF0\x9F\x98\x82\xF0\x9F…’ for column ‘nick’ at row 1
我们知道设置数据库编码格式,表编码格式和字段编码格式的时候,一般设置为“utf-8”,这对于汉字来说足够了,在mysql中utf8占3个字节,但是对于移动端的特殊emoj表情符号来说,三个字节是不够的,他需要四个字节。这个时候我们使用utf8就会出现‘\xF0\x9F\x8F\x80’的问题。

解决方式:

1. 可以对4字节的字符进行编码存储,然后取出来的时候,再进行解码。或者使用emoj转码依赖包 但是这样做会使得任何使用该字符的地方都要进行编码与解码。

        <!--    emoji表情包处理    -->
        <dependency>
            <groupId>com.vdurmont</groupId>
            <artifactId>emoji-java</artifactId>
            <version>3.2.0</version>
        </dependency>

在使用时这样

String nick = EmojiParser.parseToAliases(nickName);//将表情符号转为字符
String nick = EmojiParser.parseToUnicode(nickName); //将字符转为表情符号

如此即便使用AOP依旧不是很好处理 。

2.更改数据库的编码为utf8mb4:utf8mb4编码是utf8编码的超集,兼容utf8,并且能存储4字节的表情字符。 
采用utf8mb4编码的好处是:存储与获取数据的时候,不用再考虑表情字符的编码与解码问题。

需要改数据库表的编码格式,将至修改为utf8mb4. mysql版本5.5.3之前支持utf8三个字节,5.5.3之后支持utf8mb4四个字节。mysql -V 查看版本,如果版本过低,先升级。

数据库字符集
数据库字符集排序规则

注意: 要连同表和字段的属性一同改为utf8mb4:

表属性
字段属性

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注