博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Csharp--Read Csv file to DataTable
阅读量:5059 次
发布时间:2019-06-12

本文共 4067 字,大约阅读时间需要 13 分钟。

在网上找的资料都不怎么好使,许多代码一看就知道根本没有考虑全面。

最后找到一个好用的,在codeproject上,这位老兄写成了一个framework,太重了。

确实挺好用的。

我没耐下性子看他的实现,自己尝试写了如下的代码来完成了阅读csv.

参照:

只写了两个方法,组织得不是特别优雅。

使用的时候只需要调用ReadCsv2DT即可,传入参数是文件路径和第一行是否是Header的布尔值。

第二个方法是替换CSVWriter封装的多余的双引号。

   

public static DataTable ReadCsv2DT(string filename,bool isFirstLineHeader)        {            DataTable dt = new DataTable();            int quotecount = 0;            int lastbyte = 0;            int b = 0;            DataRow dr = null;            bool isfirstline = true;            int colindex = 0;            List
firstlinefields = new List
(); StringBuilder sb = new StringBuilder(); using (FileStream fs = File.OpenRead(filename)) { while ((b = fs.ReadByte()) != -1) { if (!isfirstline && dr == null) dr = dt.NewRow(); if (b == 10 && lastbyte == 13 && quotecount % 2 == 0) //one row finished { if (!isfirstline) { dr[colindex] = removeTextQualifier(sb.ToString()); dt.Rows.Add(dr); } else { if (isFirstLineHeader) dt.Columns.Add(removeTextQualifier(sb.ToString())); else firstlinefields.Add(removeTextQualifier(sb.ToString())); //build the table strucure if (isfirstline && !isFirstLineHeader) { for (int i = 1; i <= firstlinefields.Count; i++) { dt.Columns.Add("col" + i); } dr = dt.NewRow(); for (int j = 0; j < firstlinefields.Count; j++) { dr[j] = firstlinefields[j]; } dt.Rows.Add(dr); } isfirstline = false; } sb.Clear(); quotecount = 0; b = 0; dr = null; colindex = 0; lastbyte = 0; } else if (b == 44 && quotecount % 2 == 0) //one filed found 44 stand for comma { if (isfirstline) { if (isFirstLineHeader) dt.Columns.Add(removeTextQualifier(sb.ToString())); else firstlinefields.Add(removeTextQualifier(sb.ToString())); } else dr[colindex] =removeTextQualifier(sb.ToString()); sb.Clear(); colindex++; } else { if (b == 34) quotecount++; //" lastbyte = b; sb.Append(UnicodeEncoding.ASCII.GetString(new byte[] { byte.Parse(b.ToString()) })); } } }; return dt; } public static string removeTextQualifier(string text) { string pattern = "^\"(?
[\\s\\S]*?)\"[\r\n]*$"; Regex rgx = new Regex(pattern,RegexOptions.Multiline); Match m = rgx.Match(text); if (m.Success) //return m.Result("($1)").Replace("\"\"", "\""); return m.Groups["word"].Value.Replace("\"\"", "\""); else return text.Replace("\"\"", "\""); } }

 

效果图:测试了一个文件,效果还可以,和Excel打开显示的无差异。

如果你需要测试的话,请确保自己写的文件是有效的csv文件,否则请使用excel另存为,自己写的文件改后缀不是真正的csv.

转载于:https://www.cnblogs.com/huaxiaoyao/p/4143939.html

你可能感兴趣的文章
51nod 1018排序
查看>>
sqlite的坑
查看>>
Elastic Search 上市了,市值翻倍,这群人财务自由了!
查看>>
digitalocean --- How To Install Apache Tomcat 8 on Ubuntu 16.04
查看>>
linux swoole
查看>>
An Easy Problem?! - POJ 2826(求面积)
查看>>
【题解】[P4178 Tree]
查看>>
Jquery ui widget开发
查看>>
css3实现循环执行动画,且动画每次都有延迟
查看>>
更改git仓库地址
查看>>
有标号DAG计数 [容斥原理 子集反演 组合数学 fft]
查看>>
Recipe 1.4. Reversing a String by Words or Characters
查看>>
Rule 1: Make Fewer HTTP Requests(Chapter 1 of High performance Web Sites)
查看>>
sql注入
查看>>
「破解」Xposed强
查看>>
Linux 平台下 MySQL 5.5 安装 说明 与 示例
查看>>
src与href的区别
查看>>
ABAP工作区,内表,标题行的定义和区别
查看>>
《xxx重大需求征集系统的》可用性和可修改性战术分析
查看>>
Python 中 创建类方法为什么要加self
查看>>