首页 | 互联网 | IT动态 | IT培训 | Cisco | Windows | Linux | Java | .Net | Oracle | 软件测试 | C/C++ | 嵌入式开发 | 存储世界 | 服务器
网络设备 | IDC | 安全 | 求职招聘 | 数字网校 | 网页设计 | 平面设计 | 技术专题 | 电子书下载 | 教学视频 | 源码下载 | 搜索 | 博客 | 论坛
中国IT实验室Dotnet频道
中国IT教育
Google
首页 ASP.NET  C#  XML/WebService ADO.NET VC.NET VB.NET .NET 资讯动态 专题 RSS订阅 讨论 下载
您现在的位置: 中国IT实验室 >> Dotnet >> C# >> 正文

.NET自动字符编码识别程序库 NChardet

   int lang = 2 ;//
   //用指定的语参数实例化Detector
   Detector det = new Detector(lang) ;
   //初始化
   MyCharsetDetectionObserver cdo = new MyCharsetDetectionObserver();
   det.Init(cdo);
  
   //输入字符流
   Uri url = new Uri(“http://cn.yahoo.com”);
   HttpWebRequest request =
   HttpWebRequest)WebRequest.Create(url);
   HttpWebResponse response =
   (HttpWebResponse)request.GetResponse();
   Stream stream = response.GetResponseStream();
  
   byte[] buf = new byte[1024] ;
   int len;
   bool done = false ;
   bool isAscii = true ;
  
   while( (len=stream.Read(buf,0,buf.Length)) != 0) {
   // 探测是否为Ascii编码
   if (isAscii)
   isAscii = det.isAscii(buf,len);
  
   // 如果不是Ascii编码,并且编码未确定,则继续探测
   if (!isAscii && !done)
   done = det.DoIt(buf,len, false);
  
   }
   stream.Close();
   stream.Dispose();
   //调用DatEnd方法,
   //如果引擎认为已经探测出了正确的编码,
  //则会在此时调用ICharsetDetectionObserver的Notify方法
   det.DataEnd();
  
   if (isAscii) {
   Console.WriteLine("CHARSET = ASCII");
   found = true ;
   }
   else if (cdo.Charset != null)
   {
   Console.WriteLine("CHARSET = {0}",cdo.Charset);
   found = true;
   }
  
   if (!found) {
   string[] prob = det.getProbableCharsets() ;
   for(int i=0; i<prob.Length; i++) {
   Console.WriteLine("Probable Charset = " + prob[i]);
   }
   }
   Console.ReadLine();
  http://www.cnblogs.com/hhh/archive/2007/01/27/632251.html

上一页  [1] [2] 

【责编:Peng】

中国IT教育

相关产品和培训
文章评论
 友情推荐链接
 认证培训
 专题推荐

 ·WEB程序开发--ASP.NET和PHP、JSP究竟学哪个?
 ·五步带你入门XML
 ·关于Java框架技术专题
 ·XML全攻略技术专题
 ·JAVA开源技术介绍专题
 ·Java嵌入式开发之J2ME技术专题
 ·超前体验 Oracle 11g的5个新特性…
 ·揭密使用VB.NET的五个实用技巧
 ·Oracle和SQL Server常用函数对比专题…
 ·展现C#世界 C#程序设计专题…
 今日更新
 社区讨论
 博客论点
 频道精选
 Dotnet频道相关导航