关闭 x
IT技术网
    技 采 号
    ITJS.cn - 技术改变世界
    • 实用工具
    • 菜鸟教程
    IT采购网 中国存储网 科技号 CIO智库

    IT技术网

    IT采购网
    • 首页
    • 行业资讯
    • 系统运维
      • 操作系统
        • Windows
        • Linux
        • Mac OS
      • 数据库
        • MySQL
        • Oracle
        • SQL Server
      • 网站建设
    • 人工智能
    • 半导体芯片
    • 笔记本电脑
    • 智能手机
    • 智能汽车
    • 编程语言
    IT技术网 - ITJS.CN
    首页 » 程序人生 »你的代码糟粕比精华要多得多

    你的代码糟粕比精华要多得多

    2015-08-02 00:00:00 出处:极客头条
    分享

    新的研究发现,一个程序的核心功能仅在于一小部分封装的代码。

    要是你是一个软件开发人员,有人问你,你写的代码中有多少是真正在实现实际功能的,有多少是填充物、无价值的或者只是因为实际运行编程语言所需要的? 95%? 75%? 50%?都不是!新的研究发现,只有大约5%的代码是真正在提供核心功能。

    研究人员认为,就像自然语言一样,一些——甚至可能是绝大多数——写下的代码其实对于功能是不起作用的。《stalks of wheat》一文的作者认为,只有一部分代码代表了功能的语义核心,我们称之为精华,而其他的则是糟粕。

    A combine harvester works on a wheat field

    该作者表示,一个功能的核心可以被封装于一个小型的关键字集合中,这被称为“minimum distinguishing subset” (“最小的区别化子集”)或MINSET。我们可以通过将方法分解为词素(即,通过空格或标点符号分隔代码),丢弃那些对函数行为不重要的内容,同时把剩下的映射到关键字中。然后将那些关键字导入到MINSET。

    为了检验此理论,即MINSET中的代码只占全部代码的一小部分,研究人员下载了1000个来自Apache、Eclipse、GitHub和SourceForge最受欢迎的Java项目。在合计超过10亿行的Java代码中,先剔除简单的方法( tokens低于50)。就只剩下不到190万的不同方法,然后从中随机抽取10,000条,确定它们的MINSET。研究中使用的代码和数据可从Bitbucket下载。

    以下为研究发现的主要结果:

    MINSETS出奇的小。方法的平均MINSET大小为1.55个关键字,最大值为6。 MINSET的大小并不随方法规模的增加而变大。事实上,要是只看最大的1000个方法,其平均和最大MINSET关键字分别为降到1.12和4,这表明,正如作者所言:“即便是对于一些异常庞大的方法,MINSET也是一项既独特又灵活有效的指标。” 大多数代码几乎尽是糟粕。平均来说,在一个方法中只有4.6%的独特词素可以位列MINSET。也就是说,95%以上的代码都是糟粕。

    不过有几处关键的地方需要指出来。首先,MINSET本身是不可执行的:它只是表征了核心功能的代码的最小集合。剩下95%中的一些代码(前面称之为糟粕)也不是无用的,因为还需要它们来运行程序。其次,尽管这项研究仅着眼于Java代码,不过由于语言的相似性,作者表示这些发现应该也适用于其他语言,特别是C语言和C++。

    关于此项工作的意义?研究人员指出了MINSETs的潜在应用:

    改进代码搜索——MINSETs可用于基于相似查询的代码搜索结果排名。 智能IDE——具备了MINSETs索引数据库的IDE可用于提出类似的代码,支持自动代码填充,加快调试过程。 备选的编程形式——MINSETs可用于支持基于关键字的编程,也就是说,我们可以通过一个小型的关键字组来创建可用的代码。
    上一篇返回首页 下一篇

    声明: 此文观点不代表本站立场;转载务必保留本文链接;版权疑问请联系我们。

    别人在看

    67款移动应用存在违法违规收集使用个人信息情况

    高通、联发科、汇顶科技等“芯”助力,vivo X200 Ultra及X200s发布

    微软CTO凯文·斯科特:未来AI行业将涌现大量专业智能体

    《中国AIGC产业峰会——万物皆可AI》在北京圆满落幕

    威联通科技推出 16 颗硬盘 SAS 双主动控制器 ES1686dc R2 3U 机架式 NAS,具备 HA 及最佳存储效率

    当漏洞攻击遇上腾讯混元超能力:EdgeOne的Web安全赛博决斗

    上海外骨骼机器人亮相消博会,万元起售引关注,加速研发个人版

    深耕智能文档处理领域,合合信息《智能文档技术与应用白皮书》正式发布

    RootPhone:开启RWA代币化时代的Web3智能终端革命

    华为Mate 80系列全曝光:将出厂预装原生鸿蒙操作系统

    IT头条

    平替CUDA!摩尔线程发布MUSA 4性能分析工具

    00:43

    三起案件揭开侵犯个人信息犯罪的黑灰产业链

    13:59

    百度三年开放2.1万实习岗,全力培育AI领域未来领袖

    00:36

    工信部:一季度,电信业务总量同比增长7.7%,业务收入累计完成4469亿元

    23:42

    Gartner:2024年全球半导体营收6559亿美元,AI助力英伟达首登榜首

    18:04

    技术分享

    iOS 8 中如何集成 Touch ID 功能

    windows7系统中鼠标滑轮键(中键)的快捷应用

    MySQL数据库的23个特别注意的安全事项

    Kruskal 最小生成树算法

    Ubuntu 14.10上安装新的字体图文教程

    Ubuntu14更新后无法进入系统卡在光标界面解怎么办?

      友情链接:
    • IT采购网
    • 科技号
    • 中国存储网
    • 存储网
    • 半导体联盟
    • 医疗软件网
    • 软件中国
    • ITbrand
    • 采购中国
    • CIO智库
    • 考研题库
    • 法务网
    • AI工具网
    • 电子芯片网
    • 安全库
    • 隐私保护
    • 版权申明
    • 联系我们
    IT技术网 版权所有 © 2020-2025,京ICP备14047533号-20,Power by OK设计网

    在上方输入关键词后,回车键 开始搜索。Esc键 取消该搜索窗口。