关闭 x
IT技术网
    技 采 号
    ITJS.cn - 技术改变世界
    • 实用工具
    • 菜鸟教程
    IT采购网 中国存储网 科技号 CIO智库

    IT技术网

    IT采购网
    • 首页
    • 行业资讯
    • 系统运维
      • 操作系统
        • Windows
        • Linux
        • Mac OS
      • 数据库
        • MySQL
        • Oracle
        • SQL Server
      • 网站建设
    • 人工智能
    • 半导体芯片
    • 笔记本电脑
    • 智能手机
    • 智能汽车
    • 编程语言
    IT技术网 - ITJS.CN
    首页 » HTML5 »Linux 内核里的“智能指针”

    Linux 内核里的“智能指针”

    2015-07-17 00:00:00 出处:oschina
    分享

    众所周知,C/C++语言本身并不支持垃圾回收机制,虽然语言本身具有极高的灵活性,但是当遇到大型的项目时,繁琐的内存管理往往让人痛苦异常。现代的C/C++类库一般会提供智能指针来作为内存管理的折中方案,比如STL的auto_ptr,Boost的Smart_ptr库,QT的QPointer家族,甚至是基于C语言构建的GTK+也通过引用计数来实现类似的功能。Linux内核是如何解决这个问题呢?同样作为C语言的解决方案,Linux内核采用的也是引用计数的方式。假如您更熟悉C++,可以把它类比为Boost的shared_ptr,或者是QT的QSharedPointer。

    在Linux内核里,引用计数是通过 struct kref 结构来实现的。在介绍如何使用 kref 之前,我们先来假设一个情景。假如您开发的是一个字符设备驱动,当设备插上时,系统自动建立一个设备节点,用户通过文件操作来访问设备节点。

    如上图所示,最左边的绿色框图表示实际设备的插拔动作,中间黄色的框图表示内核中设备对象的生存周期,右边蓝色的框图表示用户程序系统调用的顺序。假如用户程序正在访问的时候设备突然被拔掉,驱动程序里的设备对象是否立刻释放呢?假如立刻释放,用户程序执行的系统调用一定会发生内存非法访问;假如要等到用户程序close之后再释放设备对象,我们应该怎么来实现?kref就是为了解决类似的问题而生的。

    kref的定义非常简单,其结构体里只有一个原子变量。

    struct kref {
     atomic_t refcount;
    };

    Linux内核定义了下面三个函数接口来使用kref:

    void kref_init(struct kref *kref);
    void kref_get(struct kref *kref);
    int kref_put(struct kref *kref, void (*release) (struct kref *kref));

    我们先通过一段伪代码来了解一下如何使用kref。

    struct my_obj
    {
     int val;
     struct kref refcnt;
    };
    
    struct my_obj *obj;
    
    void obj_release(struct kref *ref) 
    {
     struct my_obj *obj = container_of(ref, struct my_obj, refcnt);
     kfree(obj);
    }
    
    device_probe() 
    {
     obj = kmalloc(sizeof(*obj), GFP_KERNEL);
     kref_init(&obj->refcnt);
    }
    
    device_disconnect() 
    {
     kref_put(&obj->refcnt, obj_release);
    }
    
    .open() 
    {
     kref_get(&obj->refcnt);
    }
    
    .close() 
    {
     kref_put(&obj->refcnt, obj_release);
    }

    在这段代码里,我们定义了obj_release来作为释放设备对象的函数,当引用计数为0时,这个函数会被立刻调用来执行真正的释放动作。我们先在device_probe里把引用计数初始化为1,当用户程序调用open时,引用计数又会被加1,之后假如设备被拔掉,device_disconnect会减掉一个计数,但此时refcnt还不是0,设备对象obj并不会被释放,只有当close被调用之后,obj_release才会执行。

    看完伪代码之后,我们再来实战一下。为了节省篇幅,这个实作并没有建立一个字符设备,只是通过模块的加载和卸载过程来对感受一下kref。

    #include <linux/kernel.h>
    #include <linux/module.h>
    
    struct my_obj {
     int val;
     struct kref refcnt;
    };
    
    struct my_obj *obj;
    
    void obj_release(struct kref *ref)
    {
     struct my_obj *obj = container_of(ref, struct my_obj, refcnt);
     printk(KERN_INFO "obj_releasen");
     kfree(obj);
    }
    
    static int __init kreftest_init(void)
    {
     printk(KERN_INFO "kreftest_initn");
     obj = kmalloc(sizeof(*obj), GFP_KERNEL);
     kref_init(&obj->refcnt);
     return 0;
    }
    
    static void __exit kreftest_exit(void)
    {
     printk(KERN_INFO "kreftest_exitn");
     kref_put(&obj->refcnt, obj_release);
     return;
    }
    
    module_init(kreftest_init);
    module_exit(kreftest_exit);
    
    MODULE_LICENSE("GPL");

    通过kbuild编译之后我们得到kref_test.ko,然后我们顺序执行以下命令来挂载和卸载模块。

    sudo insmod ./kref_test.ko

    sudo rmmod kref_test

    此时,系统日志会打印出如下消息:

    kreftest_init

    kreftest_exit

    obj_release

    这正是我们预期的结果。

    有了kref引用计数,即使内核驱动写的再复杂,我们对内存管理也应该有信心了吧。

    接下来主要介绍几点使用kref时的注意事项。

    Linux内核文档kref.txt罗列了三条规则,我们在使用kref时必须遵守。

    规则一:

    If you make a non-temporary copy of a pointer, especially if it can be passed to another thread of execution, you must increment the refcount with kref_get() before passing it off;

    规则二:

    When you are done with a pointer, you must call kref_put();

    规则三:

    If the code attempts to gain a reference to a kref-ed structure without already holding a valid pointer, it must serialize access where a kref_put() cannot occur during the kref_get(), and the structure must remain valid during the kref_get().

    对于规则一,其实主要是针对多条执行路径(比如另起一个线程)的情况。假如是在单一的执行路径里,比如把指针传递给一个函数,是不需要使用kref_get的。看下面这个例子:

    kref_init(&obj->ref);
    
    // do something here
    // ...
    
    kref_get(&obj->ref);
    call_something(obj);
    kref_put(&obj->ref);
    
    // do something here
    // ...
    
    kref_put(&obj->ref);

    您是不是觉得call_something前后的一对kref_get和kref_put很多余呢?obj并没有逃出我们的掌控,所以它们确实是没有必要的。

    但是当遇到多条执行路径的情况就完全不一样了,我们必须遵守规则一。下面是摘自内核文档里的一个例子:

    struct my_data
    {
     .
     .
     struct kref refcount;
     .
     .
    };
    
    void data_release(struct kref *ref)
    {
     struct my_data *data = container_of(ref, struct my_data, refcount);
     kfree(data);
    }
    
    void more_data_handling(void *cb_data)
    {
     struct my_data *data = cb_data;
     .
     . do stuff with data here
     .
     kref_put(&data->refcount, data_release);
    }
    
    int my_data_handler(void)
    {
     int rv = 0;
     struct my_data *data;
     struct task_struct *task;
     data = kmalloc(sizeof(*data), GFP_KERNEL);
     if (!data)
     return -ENOMEM;
     kref_init(&data->refcount);
    
     kref_get(&data->refcount);
     task = kthread_run(more_data_handling, data, "more_data_handling");
     if (task == ERR_PTR(-ENOMEM)) {
     rv = -ENOMEM;
     goto out;
     }
    
     .
     . do stuff with data here
     .
     out:
     kref_put(&data->refcount, data_release);
     return rv;
    }

    因为我们并不知道线程more_data_handling何时结束,所以要用kref_get来保护我们的数据。

    注意规则一里的那个单词“before”,kref_get必须是在传递指针之前进行,在本例里就是在调用kthread_run之前就要执行kref_get,否则,何谈保护呢?

    对于规则二我们就不必多说了,前面调用了kref_get,自然要配对使用kref_put。

    规则三主要是处理遇到链表的情况。我们假设一个情景,假如有一个链表摆在你的面前,链表里的节点是用引用计数保护的,那你如何操作呢?首先我们需要获得节点的指针,然后才可能调用kref_get来增加该节点的引用计数。根据规则三,这种情况下大家要对上述的两个动作串行化处理,一般我们可以用mutex来实现。请看下面这个例子:

    static DEFINE_MUTEX(mutex);
    static LIST_HEAD(q);
    struct my_data
    {
     struct kref refcount;
     struct list_head link;
    };
    
    static struct my_data *get_entry()
    {
     struct my_data *entry = NULL;
     mutex_lock(&mutex);
     if (!list_empty(&q)) {
     entry = container_of(q.next, struct my_q_entry, link);
     kref_get(&entry->refcount);
     }
     mutex_unlock(&mutex);
     return entry;
    }
    
    static void release_entry(struct kref *ref)
    {
     struct my_data *entry = container_of(ref, struct my_data, refcount);
    
     list_del(&entry->link);
     kfree(entry);
    }
    
    static void put_entry(struct my_data *entry)
    {
     mutex_lock(&mutex);
     kref_put(&entry->refcount, release_entry);
     mutex_unlock(&mutex);
    }

    这个例子里已经用mutex来进行保护了,假如我们把mutex拿掉,会出现什么情况?记住,我们遇到的很可能是多线程操作。假如线程A在用container_of取得entry指针之后、调用kref_get之前,被线程B抢先执行,而线程B碰巧又做的是kref_put的操作,当线程A恢复执行时一定会出现内存访问的错误,所以,遇到这种情况一定要串行化处理。

    我们在使用kref的时候要严格遵循这三条规则,才能安全有效的管理数据。

    上一篇返回首页 下一篇

    声明: 此文观点不代表本站立场;转载务必保留本文链接;版权疑问请联系我们。

    别人在看

    帝国CMS7.5编辑器上传图片取消宽高的三种方法

    帝国cms如何自动生成缩略图的实现方法

    Windows 12即将到来,将彻底改变人机交互

    帝国CMS 7.5忘记登陆账号密码怎么办?可以phpmyadmin中重置管理员密码

    帝国CMS 7.5 后台编辑器换行,修改回车键br换行为p标签

    Windows 11 版本与 Windows 10比较,新功能一览

    Windows 11激活产品密钥收集及专业版激活方法

    如何从 Windows 11 中完全删除/卸载 OneNote?无解!

    抖音安全与信任开放日:揭秘推荐算法,告别单一标签依赖

    ultraedit编辑器打开文件时,总是提示是否转换为DOS格式,如何关闭?

    IT头条

    华为Pura80系列新机预热,余承东力赞其复杂光线下的视频拍摄实力

    01:28

    阿里千问3开源首战告捷:全球下载破千万,国产AI模型崛起新高度!

    01:22

    DeepSeek R1小版本试升级:网友实测编程能力已达到国际一线水平

    23:15

    NVIDIA 与 Dell 合作,大规模交付 Blackwell AI 系统

    20:52

    Cerebras 以最快的 Llama 4 Maverick 性能引领 LLM 推理竞赛

    20:51

    技术热点

    PHP中的随机性——你觉得自己幸运吗?

    搞定Ubuntu Linux下WPA无线上网

    Java使用内存映射实现大文件的上传

    MySQL安全性指南

    MySQL两项性能的基本测试浅谈

    教您使用UniqueIdentifier选取SQL Server主键

      友情链接:
    • IT采购网
    • 科技号
    • 中国存储网
    • 存储网
    • 半导体联盟
    • 医疗软件网
    • 软件中国
    • ITbrand
    • 采购中国
    • CIO智库
    • 考研题库
    • 法务网
    • AI工具网
    • 电子芯片网
    • 安全库
    • 隐私保护
    • 版权申明
    • 联系我们
    IT技术网 版权所有 © 2020-2025,京ICP备14047533号-20,Power by OK设计网

    在上方输入关键词后,回车键 开始搜索。Esc键 取消该搜索窗口。