关闭 x
IT技术网
    技 采 号
    ITJS.cn - 技术改变世界
    • 实用工具
    • 菜鸟教程
    IT采购网 中国存储网 科技号 CIO智库

    IT技术网

    IT采购网
    • 首页
    • 行业资讯
    • 系统运维
      • 操作系统
        • Windows
        • Linux
        • Mac OS
      • 数据库
        • MySQL
        • Oracle
        • SQL Server
      • 网站建设
    • 人工智能
    • 半导体芯片
    • 笔记本电脑
    • 智能手机
    • 智能汽车
    • 编程语言
    IT技术网 - ITJS.CN
    首页 » JAVA »使用Java 8的Stream API列出ZIP文件中的条目

    使用Java 8的Stream API列出ZIP文件中的条目

    2015-03-25 00:00:00 出处:ImportNew - 林申
    分享

    Java 8中的java.util.zip.ZipFile包中提供了stream方法,能够非常容易的获取ZIP压缩包中的条目。在这篇文章中,我会通过一系列的示例来展示我们可以非常快速的遍历ZIP文件中的条目。

    注意:为了在这篇博客中做演示,我从GitHub上以ZIP文件的形式下载了我的一个项目,放在了c:/tmp目录下。

    Java7之前的做法

    在Java7之前,读取一个ZIP文件中的条目的做法,恩……需要一点点小技巧。当你看到下面的代码的时候,大概就会开始有点讨厌Java了。

    public class Zipper {
        public void printEntries(PrintStream stream, String zip)  {
            ZipFile zipFile = null;
            try {
                zipFile = new ZipFile(zip);
                Enumeration<  extends ZipEntry> entries = zipFile.entries();
                while (entries.hasMoreElements()) {
                    ZipEntry zipEntry = entries.nextElement();
                    stream.println(zipEntry.getName());
                }
            } catch (IOException e) {
                // error while opening a ZIP file
            } finally {
                if (zipFile != null) {
                    try {
                        zipFile.close();
                    } catch (IOException e) {
                        // do something
                    }
                }
            }
        }
    }

    Java 7的做法

    多谢有了try-with-resources这样新的try代码块的写法,在Java 7中的代码变得稍微好了一些,但我们还是被“强迫”来使用Enumeration来遍历ZIP压缩包中的条目:

    public class Zipper {
        public void printEntries(PrintStream stream, String zip) {
            try (ZipFile zipFile = new ZipFile(zip)) {
                Enumeration<  extends ZipEntry> entries = zipFile.entries();
                while (entries.hasMoreElements()) {
                    ZipEntry zipEntry = entries.nextElement();
                    stream.println(zipEntry.getName());
                }
            } catch (IOException e) {
                // error while opening a ZIP file
            }
        }
    }

    使用Strean API

    真正有意思的是从Java 8开始,Java 8提供在java.util.zip.ZipFile包中提供新的stream方法,能够返回ZIP压缩包中的条目的有序的流,使得Java在处理ZIP压缩包时有了更多的选择。前文提到的读取压缩包的条目的代码可以改写成如下简单的形式:

    public class Zipper {
        public void printEntries(PrintStream stream, String zip) {
            try (ZipFile zipFile = new ZipFile(zip)) {
                zipFile.stream()
                        .forEach(stream::println);
            } catch (IOException e) {
                // error while opening a ZIP file
            }
        }
    }

    如下文所示,有了Stream API,我们有了更多更有趣的方式来处理ZIP文件。

    对ZIP压缩包的内容进行过滤和排序

    public void printEntries(PrintStream stream, String zip) {
        try (ZipFile zipFile = new ZipFile(zip)) {
            Predicate<ZipEntry> isFile = ze -> !ze.isDirectory();
            Predicate<ZipEntry> isJava = ze -> ze.getName().matches(".*java");
            Comparator<ZipEntry> bySize = 
                    (ze1, ze2) -> Long.valueOf(ze2.getSize() - ze1.getSize()).intValue();
            zipFile.stream()
                    .filter(isFile.and(isJava))
                    .sorted(bySize)
                    .forEach(ze -> print(stream, ze));
        } catch (IOException e) {
            // error while opening a ZIP file
        }
    }
    
    private void print(PrintStream stream, ZipEntry zipEntry) {
        stream.println(zipEntry.getName() + ", size = " + zipEntry.getSize());
    }

    在迭代ZIP压缩包的条目时,我检查了这个条目是否是一个文件并且是否匹配一个给定的字段(为了简单,直接把匹配字段硬编码在代码中了),然后利用一个给定的比较器,对这些条目按照大小进行了排序。

    为ZIP压缩包创建文件索引

    在这个例子中,我把ZIP压缩包中的条目按照文件名的首字母分组,建立形如Map<String, List<ZipEntry>>的索引,预想的结果应该看起来像这样简单:

    a = [someFile/starting/with/an/A]
    u = [someFile/starting/with/an/U, someOtherFile/starting/with/an/U]

    同样,使用Stream API来实现这个功能非常简单:

    public void printEntries(PrintStream stream, String zip) {
        try (ZipFile zipFile = new ZipFile(zip)) {
            Predicate<ZipEntry> isFile = ze -> !ze.isDirectory();
            Predicate<ZipEntry> isJava = ze -> ze.getName().matches(".*java");
            Comparator<ZipEntry> bySize =
                (ze1, ze2) -> Long.valueOf(ze2.getSize()).compareTo(Long.valueOf(ze1.getSize()));
    
            Map<String, List<ZipEntry>> result = zipFile.stream()
                    .filter(isFile.and(isJava))
                    .sorted(bySize)
                    .collect(groupingBy(this::fileIndex));
    
            result.entrySet().stream().forEach(stream::println);
    
        } catch (IOException e) {
            // error while opening a ZIP file
        }
    }
    
    private String fileIndex(ZipEntry zipEntry) {
        Path path = Paths.get(zipEntry.getName());
        Path fileName = path.getFileName();
        return fileName.toString().substring(0, 1).toLowerCase();
    }

    在ZIP压缩包的文件中查找字段

    在这最后一个例子中,我在压缩包中的查找所有以.java结尾的且包含@Test字段的文件,这次,我将利用BufferedReader类的lines方法来实现,这个lines方法按行返回文件流。

    public void printEntries(PrintStream stream, String zip) {
    
        try (ZipFile zipFile = new ZipFile(zip)) {
            Predicate<ZipEntry> isFile = ze -> !ze.isDirectory();
            Predicate<ZipEntry> isJava = ze -> ze.getName().matches(".*java");
    
            List<ZipEntry> result = zipFile.stream()
                    .filter(isFile.and(isJava))
                    .filter(ze -> containsText(zipFile, ze, "@Test"))
                    .collect(Collectors.toList());
    
            result.forEach(stream::println);
    
        } catch (IOException e) {
            // error while opening a ZIP file
        }
    }
    
    private boolean containsText(ZipFile zipFile, ZipEntry zipEntry, String needle) {
        try (InputStream inputStream = zipFile.getInputStream(zipEntry);
             BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream))) {
    
            Optional<String> found = reader.lines()
                    .filter(l -> l.contains(needle))
                    .findFirst();
    
            return found.isPresent();
    
        } catch (IOException e) {
            return false;
        }
    }

    总结

    在我看来,Stream API提供了一个强大的并且相对更容易的方案来解决遍历ZIP压缩包中的条目的问题。

    ITJS的这篇文章中出现的例子只是用来演示说明Stream API的用法的,都是相对容易的,但我希望你能够喜欢这些例子,并且觉得他对你有用。

    上一篇返回首页 下一篇

    声明: 此文观点不代表本站立场;转载务必保留本文链接;版权疑问请联系我们。

    别人在看

    正版 Windows 11产品密钥怎么查找/查看?

    还有3个月,微软将停止 Windows 10 的更新

    Windows 10 终止支持后,企业为何要立即升级?

    Windows 10 将于 2025年10 月终止技术支持,建议迁移到 Windows 11

    Windows 12 发布推迟,微软正全力筹备Windows 11 25H2更新

    Linux 退出 mail的命令是什么

    Linux 提醒 No space left on device,但我的空间看起来还有不少空余呢

    hiberfil.sys文件可以删除吗?了解该文件并手把手教你删除C盘的hiberfil.sys文件

    Window 10和 Windows 11哪个好?答案是:看你自己的需求

    盗版软件成公司里的“隐形炸弹”?老板们的“法务噩梦” 有救了!

    IT头条

    公安部:我国在售汽车搭载的“智驾”系统都不具备“自动驾驶”功能

    02:03

    液冷服务器概念股走强,博汇、润泽等液冷概念股票大涨

    01:17

    亚太地区的 AI 驱动型医疗保健:2025 年及以后的下一步是什么?

    16:30

    智能手机市场风云:iPhone领跑销量榜,华为缺席引争议

    15:43

    大数据算法和“老师傅”经验叠加 智慧化收储粮食尽显“科技范”

    15:17

    技术热点

    商业智能成CIO优先关注点 技术落地方显成效(1)

    用linux安装MySQL时产生问题破解

    JAVA中关于Map的九大问题

    windows 7旗舰版无法使用远程登录如何开启telnet服务

    Android View 事件分发机制详解

    MySQL用户变量的用法

      友情链接:
    • IT采购网
    • 科技号
    • 中国存储网
    • 存储网
    • 半导体联盟
    • 医疗软件网
    • 软件中国
    • ITbrand
    • 采购中国
    • CIO智库
    • 考研题库
    • 法务网
    • AI工具网
    • 电子芯片网
    • 安全库
    • 隐私保护
    • 版权申明
    • 联系我们
    IT技术网 版权所有 © 2020-2025,京ICP备14047533号-20,Power by OK设计网

    在上方输入关键词后,回车键 开始搜索。Esc键 取消该搜索窗口。