语言入口:简体中文 | English | 北亚博客
 
    
 
北亚Linux数据恢复

首席工程师:张宇

手机:18600440055

座机:4006-505-646-806

传真:4006-505-646-810

Email:zy@frombyte.com

地址:北京市海淀区永丰基地丰慧中路7号新材料创业大厦B座205室
QQ:免费咨询
当前位置:首页>>Linux修复知识>>Linux资源文档>>正文
Linux修复知识

linux环境下轻松搞定文件的编码

 通常来说,Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8,所以Linux下打开windows的文件会有乱码的情况。另外,有时要将文件进行编码转换,如将简体中文转换为繁体中文。
  基于以上情况,本文将就在linux下查看和转换文件的编码进行说明。
  1.查看文件的编码
  1)在Vim中可以直接查看文件编码
  :set fileencoding 即可显示文件编码格式。
  2)enca查看文件编码
  # enca filename 直接用enca加文件名查看
  # enca -L zh_CN filename
  注:enca对某些GBK编码的文件识别不是很好,识别时会出现:unrecognized encoding.
  2.转换文件的编码
  1)在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
  :set fileencoding=utf-8
  2)enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,如:
  # enconv -L zh_CN -x UTF-8 filename
  # enca -L zh_CN -x UTF-8 < file1 > file2 不覆盖原文件
  3)iconv 转换,iconv的命令格式如下:
  # iconv -f encoding -t encoding inputfile
  # iconv –l 查询可用编码
  # for i in `find ./ -name *.html`;do echo $i;iconv –f gb2312 –t big5 $i –o /tmp/iconv.tmp;mv /tmp/iconv.tmp $i;done
  批量转换文件编码实例之一
  3.文件名编码转换
  Linux与windows间拷贝文件,有时文件名会出现乱码,是因为Windows的文件名中文编码默认为GBK,而Linux默认的文件名为UTF8。在Linux中有个工具,convmv,可以对文件名进行GBK和UTF的相互转换。
  用法:
  Convmv –f 源编码 –t 新编码 [option] filename
  安装enca
  下载相关rpm包。地址(http://rpmfind.net/linux/RPM/dag/redhat/el5/i386/ )
  我下载的是:enca-1.10-1.el5.rf.i386.rpm和enca-devel-1.10-1.el5.rf.i386.rpm
  安装:
  # rpm -ivh enca-1.10-1.el5.rf.i386.rpm
  # rpm -ivh enca-devel-1.10-1.el5.rf.i386.rpm
上一篇:linux下用 SCP 命令进行网络传输
下一篇:Linux 3.11 的新 Logo 曝光
JFS文件系统简介
XFS文件系统简介
Reiserfs文件系统简介
EXT3文件系统简介
常见Linux文件系统简介
GRUB简介与配置
LILO的使用和配置
Linux单用户模式维护系统
引导加载程序简介
重置Linux用户口令
  版权所有@北京北亚宸星科技有限公司   京ICP备09039053号    
  总部电话:(010)82488636  中国·北京·海淀区永丰基地丰慧中路7号新材料创业大厦B座205室              站点地图   联系我们  RSS阅读
0Pal