在Linux系统下,通常都是以unicode作为文本操作的。今天就遇到一个问题。下载了一首中文歌后用mediainfo查看属性,看到专辑、歌手等都是一堆乱码,找找资料如何把GB2312编码的转换成Unicode (UTF-8)格式。
这里记录一下过程。我所用的系统为Fedora 26。Fedora是我日常使用的系统系列,在这里不说系统的好坏,只是习惯和上手舒服。大家可能听说过iconv
这个命令,可以把文字编码互相转换,这次我们就要用到mid3iconv来实现id3 tag的字符编码转换。
首先安装python3-mutagen
sudo dnf install python3-mutagen
之后可用其自带的可执行脚本进行转换。以下命令如果加上-p
则不会进行转换,进行一个dry-run。
mid3iconv -e CP936 -d xxx.mp3
再用mediainfo查看下此mp3的属性就能看到文字都被转换成utf8编码了。