在日常开发中,我们经常需要和文件打交道,特别是桌面开发,有时候就会需要加载大批量的文件,而且可能还会存在部分文件缺失的情况,那么如何才能快速的判断文件是否存在呢?如果处理不当,且文件数量比较多的时候,可能会造成卡顿等情况,进而影响程序的使用体验。今天就以一个简单的小例子,简述两种不同的判断文件是否存在的方式以及效率比较。
涉及知识点
在本示例中,涉及的知识点如下:
- 单个文件是否存在判断,通常采用File.Exists(file)来判断文件是否存在,存在返回true,不存在返回false。
- 获取目录下的文件,通常才是Directory.GetFiles(dir)来获取目录下的文件,返回目录下的文件列表。
- 计算程序执行耗时,通常采用Stopwatch进行计算,可以计算程序执行的耗时,单位可以是毫秒,秒,TimeSpan等。
前提
本示例的前提是,通常有多个文件(如:几十,几百,几千,几万)需要判断是否存在,且文件隶属于多个目录。
循环文件判断
C#默认提供的文件是否存在判断方式,一般用于单个文件,如果有多个文件,可以批量循环进行判断。步骤如下:
- 循环需要判断的文件列表
- 每个文件都判断一次文件是否存在。
代码如下所示:
/// <summary>
/// 逐一判断是否存在,并返回判断时长
/// </summary>
/// <param name="files"></param>
/// <returns></returns>
private static long CheckFileExist01(List<string> files)
{
Stopwatch stopwatch = new Stopwatch();
stopwatch.Start();
foreach (var file in files)
{
if (File.Exists(file))
{
}
}
stopwatch.Stop();
return stopwatch.ElapsedMilliseconds;
}
上述判断方式,如果有一百个文件,则会进行一百次的文件是否存在判断,都是磁盘文件判断。
统一获取判断
统一获取,即获取文件夹目录下的文件,再进行内存中判断文件是否存在。步骤如下:
- 先获取文件列表所在的文件夹,
- 获取文件夹中的所有文件,存入字典中,
- 然后通过字典判断是否包含文件
代码如下所示:
/// <summary>
/// 统一获取文件夹目录中的文件,再进行判断
/// </summary>
/// <param name="files"></param>
/// <returns></returns>
private static long CheckFileExist02(List<string> files)
{
Stopwatch stopwatch = new Stopwatch();
stopwatch.Start();
Dictionary<string,string> dictionary = new Dictionary<string, string>();
var folders = files.Select(item=>Path.GetDirectoryName(item)).Distinct().ToList();
foreach (var folder in folders)
{
var tmpFiles=Directory.GetFiles(folder);
foreach(var tmpFile in tmpFiles)
{
dictionary[tmpFile] = tmpFile;
}
}
foreach (var file in files)
{
if (dictionary.TryGetValue(file, out string a))
{
}
}
stopwatch.Stop();
return stopwatch.ElapsedMilliseconds;
}
性能比较
在本示例中,分别从不同维度进行比较,如:本地磁盘文件和共享目录中的文件,以及不同文件数量进行比较。分别如下:
1. 本地文件
本地文件,分别对10到500个文件进行判断是否存在,对两种方式的耗时比较。
其中横坐标为文件数量,纵坐标为判断文件是否存在的执行耗时(毫秒)。如下所示:
通过比较发现,对于本地文件,结论如下:
- 对于需要判断的文件数量较少时,循环单个文件和统一获取再判断,性能上并无太大差异。
- 随着需要判断的文件数量逐渐增多,循环单个文件的耗时会增加,而统一获取再内存判断,则并无太大波动。
- 受操作系统影响,性能耗时可能会存在波动。
2. 共享目录文件
共享文件,分别对10到500个文件进行判断是否存在,对两种方式的耗时比较。
其中横坐标为文件数量,纵坐标为判断文件是否存在的执行耗时(毫秒)。如下所示:
通过比较发现,对于共享目录文件,结论如下:
- 随着需要判断的文件数量逐渐增多,循环单个文件的耗时会增加,而统一获取再内存判断,则并无太大波动。
- 受操作系统或网络影响,性能耗时可能会存在波动。
结论
通过对本地文件和共享目录下文件,以及不同数量的文件进行文件是否存在校验时的耗时比较分析,结论如下:
如果需要判断的文件数量比较多,且分散存储的目录虽然不唯一,却相对较少,建议采用第二种(统一获取)方式进行校验。
以上就是【推荐一种批量判断文件是否存在的快速办法】的全部内容,希望能够一起学习,共同进步。
1.本站内容仅供参考,不作为任何法律依据。用户在使用本站内容时,应自行判断其真实性、准确性和完整性,并承担相应风险。
2.本站部分内容来源于互联网,仅用于交流学习研究知识,若侵犯了您的合法权益,请及时邮件或站内私信与本站联系,我们将尽快予以处理。
3.本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
4.根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。”您需知晓本站所有内容资源均来源于网络,仅供用户交流学习与研究使用,版权归属原版权方所有,版权争议与本站无关,用户本人下载后不能用作商业或非法用途,需在24个小时之内从您的电脑中彻底删除上述内容,否则后果均由用户承担责任;如果您访问和下载此文件,表示您同意只将此文件用于参考、学习而非其他用途,否则一切后果请您自行承担,如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。
5.本站是非经营性个人站点,所有软件信息均来自网络,所有资源仅供学习参考研究目的,并不贩卖软件,不存在任何商业目的及用途
暂无评论内容