首页 | 互联网 | IT动态 | IT培训 | Cisco | Windows | Linux | Java | .Net | Oracle | 软件测试 | C/C++ | 嵌入式开发 | 存储世界 | 服务器
网络设备 | IDC | 安全 | 求职招聘 | 数字网校 | 网页设计 | 平面设计 | 技术专题 | 电子书下载 | 教学视频 | 源码下载 | 搜索 | 博客 | 论坛
中国IT实验室Dotnet频道
中国IT教育
Google
首页 ASP.NET  C#  XML/WebService ADO.NET VC.NET VB.NET .NET 资讯动态 专题 RSS订阅 讨论 下载
您现在的位置: 中国IT实验室 >> Dotnet >> C# >> 正文

.NET自动字符编码识别程序库 NChardet

    什么是NChardet
   NChardet是mozilla自动字符编码识别程序库chardet的.NET实现,它移植自jchardet,chardet的java版实现,可实现对给定字符流的编码探测。
  
   NChardet是如何工作的
  
   NChardet通过逐个比较输入字符来猜测编码;由于是猜测,所以可能会有不能完全识别的情况;如果输入字符不能确定正确的编码,那么NChardet会给出一组可能的编码值。
  
   如何使用NChardet
  
   要使用NChardet来探测编码,需要进行如下步骤。
  
   1、使用制定的语言线索来构造Detector类的实例对象。
   2、用实现了ICharsetDetectionObserver接口的对象作为参数来调用Detector类的Init方法。
   3、传入要探测的字符流进行编码探测。
   4、调用Detector类的DataEnd方法。
   5、得到结果或可能的结果集。
  
   语言线索是一个整数,可用的语言线索有如下几个:
  
   1. Japanese
   2. Chinese
   3. Simplified Chinese
   4. Traditional Chinese
   5. Korean
   6. Dont know (默认)
  
  
   ICharsetDetectionObserver接口只有一个Notify方法,当NChardet引擎认为自己已经探测出正确的编码时,它就会调用这个Notify方法,用户程序可以从这个Nodify方法中得到通知(重写ICharsetDetectionObserver接口的Notify实现)。
  
  代码实例:
  
  
   //实现ICharsetDetectionObserver接口
   public class MyCharsetDetectionObserver :
   NChardet.ICharsetDetectionObserver
   {
   public string Charset = null;
  
   public void Notify(string charset)
   {
   Charset = charset;
   }
   } 
   
   

[1] [2] 下一页

【责编:Peng】

中国IT教育

相关产品和培训
文章评论
 友情推荐链接
 认证培训
 专题推荐

 ·WEB程序开发--ASP.NET和PHP、JSP究竟学哪个?
 ·五步带你入门XML
 ·关于Java框架技术专题
 ·XML全攻略技术专题
 ·JAVA开源技术介绍专题
 ·Java嵌入式开发之J2ME技术专题
 ·超前体验 Oracle 11g的5个新特性…
 ·揭密使用VB.NET的五个实用技巧
 ·Oracle和SQL Server常用函数对比专题…
 ·展现C#世界 C#程序设计专题…
 今日更新
 社区讨论
 博客论点
 频道精选
 Dotnet频道相关导航