博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
c#分页读取GB文本文件
阅读量:5239 次
发布时间:2019-06-14

本文共 1008 字,大约阅读时间需要 3 分钟。

应用场景:

a.我在做BI开发测试的时候,有可能面对source文件数GB的情况,如果使用一般的文本编辑器,则会卡死,或要等很久才能显示出来。

b.有时候,我们使用ascii(01)ascii(02)作为行或列的分隔符,这样的临时文件用于导数据到DB,如果文件导入过程中有错误,需要查看文件 的时候,普通的编辑器不支持换行,则会很恐怖。

为解决这两个需求,我使用c#完成了一个简单的winform的应用程序。

功能列表:

1.根据配置的行数,写测试文件,指定行终止符,列分隔符暂时没有使用上。

2根据指定的行终止符,和pagesize,分页读取文件内容,而且可以在textbyte间转换。

 Sourcecode:

主要的代码如下,使用了一个迭代器:

private IEnumerator
ReadLines(string filename){/*string line;using (TextReader reader = File.OpenText(filename)){while ((line = reader.ReadLine()) != null)yield return line;}*/StringBuilder sb = new StringBuilder();using (FileStream fs = File.OpenRead(filename)){int b = 0;while ((b=fs.ReadByte())!=-1){//textbox3 store the row terminatorif (b.ToString() == textBox3.Text.Trim()){yield return sb.ToString();sb.Clear();}elsesb.Append(UnicodeEncoding.ASCII.GetString(new byte[] { byte.Parse(b.ToString()) }));}}}

 

   

   

示例截图:

我测试了一次,生成了1个亿的数据行,在系统中显示占用6GB的空间,

我尝试读写,无卡顿情况。

可以进一步更新:

根据列行分隔符显示到gridview中,这样更清晰。

可以从后往前读文件。

   

转载于:https://www.cnblogs.com/huaxiaoyao/p/4051832.html

你可能感兴趣的文章
PAT 1145 1078| hashing哈希表 平方探测法
查看>>
Ubuntu(虚拟机)下安装Qt5.5.1
查看>>
Linux第七周学习总结——可执行程序的装载
查看>>
java.io.IOException: read failed, socket might closed or timeout, read ret: -1
查看>>
细说php(二) 变量和常量
查看>>
iOS开发网络篇之Web Service和XML数据解析
查看>>
个人寒假作业项目《印象笔记》第一天
查看>>
java 常用命令
查看>>
ZOJ 1666 G-Square Coins
查看>>
CodeForces Round #545 Div.2
查看>>
卷积中的参数
查看>>
Linux中Zabbix4.0的搭建
查看>>
《LoadRunner没有告诉你的》之六——获取有效的性能需求
查看>>
51nod1076 (边双连通)
查看>>
Item 9: Avoid Conversion Operators in Your APIs(Effective C#)
查看>>
js去除空格
查看>>
学习Spring Boot:(二十八)Spring Security 权限认证
查看>>
IT学习神器——慕课网App获App Store、Android应用市场重磅推荐
查看>>
Linux网络状态工具ss命令使用详解
查看>>
深入浅出JavaScript(2)—ECMAScript
查看>>