2015-02-24 13:50

[Java] 取得檔案編碼格式

使用 Mozilla juniversalchardet 套件

  1. import java.io.FileInputStream; 
  2. import org.mozilla.universalchardet.UniversalDetector; 
  3.  
  4. public class ReadFileCharset { 
  5.  
  6.    public static void main(String[] args) throws Exception { 
  7.  
  8.        /* 讀取檔案 */ 
  9.        FileInputStream fis = new FileInputStream("input.txt"); 
  10.  
  11.        /* 建立分析器 */ 
  12.        UniversalDetector detector = new UniversalDetector(null); 
  13.  
  14.        int nread; 
  15.        byte[] buf = new byte[4096]; 
  16.        while ((nread = fis.read(buf)) > 0 && !detector.isDone()) { 
  17.            /* 分析資料 */ 
  18.            detector.handleData(buf, 0, nread); 
  19.        } 
  20.        fis.close(); 
  21.  
  22.        detector.dataEnd(); 
  23.  
  24.        /* 取得編碼格式 */ 
  25.        String encode = detector.getDetectedCharset(); 
  26.        System.out.println(encode); 
  27.    } 
  28. } 

0 回應: