当前位置: IT大杂烩 > Ubuntu  > 《Linux内核设计与实现》读书笔记之进程地址空间

《Linux内核设计与实现》读书笔记之进程地址空间

www.someabcd.com  网友分享于:Jun 8, 2018 5:52:50 PM

标签:

1.进程的内核区域包含各种内存对象      

      进程的内核区域包含各种内存对象,比如:

1.可执行文件代码可以包含各种内存映射,称为代码段(text section)。

2.可执行文件的已初始化全局变量的内存映射,称为数据段(data section)。

3.包含未初始化全局变量,也就是bss段的零页(页面中的信息全部为0值,所以可以用于映射bss段等目的)的内存映射。

4.用于进程用户空间栈的内存映射。

5.每一个诸如c库或动态链接程序等共享库的代码段、数据段和bss段也会被载入进程的地址空间。

6.任何内存映射文件。

7.任何共享内存段

8.任何匿名的内存映射,比如由malloc()分配的内存。


2.内存描述符

     内核使用内存描述符结构体表示进程的地址空间,该结构体包含了和进程地址空间有关的全部信息。内存描述符由mm_struct结构体表示,它的定义为:

技术分享

       mm_user域记录正在使用该地址的进程数目。mmap和mm_rb这两个不同数据结构体描述的对象是相同的:该地址空间中的全部内存区域。但是前者以链表的方式存放而后者以红黑树的结构存放。内核通常会避免使用两种数据结构组织同一种数据,但此时内核这样的冗余完全派的上用场。mmap作为链表,利于简单、高效地遍历所有元素;而mm_rb则更合适搜索指定的元素。

        所有的mm_struct结构体都通过自身的mmlist域链接在一个双向链表中,该链表的首元素是init_mm内存描述符,它代表init进程的地址空间,在操作该链表的时候需要使用mmlist_lock锁来防止并发访问。

     

3.内存区域

      内存区域由vm_area_struct结构体描述,它的定义如下:

技术分享

      每个内存描述符都对应于进程地址空间中的唯一区间。vm_start域指向区间的首地址,vm_end域指向区间的尾地址。需要注意的是,在同一个地址空间内的不同内存区间不能重叠。

      vm_mm域指向和VMA相关的mm_struct结构体,注意每个VMA对其相关的mm_struct结构体来说都是唯一的,所以即使两个独立的进程将同一个文件映射到各自的地址空间,它们分别都会有一个vm_area_struct结构体来标志自己的内存区域;但是如果两个线程共享同一个地址空间,那么它们也同时共享其中的所有vm_area_struct结构体。


4.VMA标志

      VMA标志是一种位标志,它包含在vm_flags域内,标志了内存区域所包含的页面的行为和信息。当访问VMA时,需要查看其访问权限。VMA的可选标志如下所示:

技术分享


5.实际举例

      我们用一个非常简单的用户控件程序的例子,它其实什么也不做,仅仅是为了做说明用:

int main(int argc,char * argv[])

{

     return 0;

}

     下面列出该进程地址空间中包含的内存区域。其中有代码段、数据段、和bss段等。该进程与C库动态链接,那么地址空间中还将分别包含libc.so和ld.so对应的上述三种内存区域。此外,地址空间中还要包含进程栈对应的内存区域。

技术分享

      前三行分别对应C库中libc.so的代码段、数据段、和bss段,接下来三行是动态链接程序ld.so的代码段、数据段、和bss段,最后一行是进程的栈。

      该进程的全部地址空间大约1340KB,但是只有约40KB的内存区域是可写和私有的。如果一片内存范围是共享的或不可写的,那么内核只需要在内存为文件保留一份映射多以C库在无力内存中仅仅需要占用1212KB的空间,而不需要为每个使用C库的进程在内存中都保存一个1212KB的空间。进程访问了1340KB的数据和代码空间,然而仅仅消耗了40KB的物理内存,可以看出利用这种共享不可写内存的方法节约了大量的内存。

      注意没有映射文件的内存区域的设备标志位00:00,索引节点标志也为0,这个区域就是零页。如果将零页映射到可写的内存区域,那么该区域将被初始化为全0。这是零页的一个重要的用处,而bss段需要的就是全0的内存区域。由于内存未被共享,所以只要一有进程写该数据,那么该数据就将被拷贝出来(就是我们说的写时拷贝),然后才被更新。


6.动态链接的过程举例(参考《CSAPP》)

      动态链接的过程如下所示:

技术分享

      在创建可执行文件p2时,没有任何libvector.so的代码和数据节真的被拷贝到可执行文件p2中,链接器只拷贝了一些重定位和符号表信息,它们使得运行时可以解析对libvector.so中代码和数据的引用。

      当加载器加载和运行可执行文件时,它注意到可执行文件有一个.interp节,这个节包含动态链接器的路径名,动态链接器本身就是一个共享目标,加载器不再像它通常那样将控制传递给可执行程序,而是加载和运行这个动态链接器。然后,动态链接器通过执行下面的重定位完成链接任务:

·重定位libc.so的文本和数据到某个存储器段。

·重定位libvector.so的文本和数据到另一个存储器段。

·重定位p2中所有由libc.so和libvector.so定义的符号引用。

      最后,动态链接器将控制全转移给应用。

《Linux内核设计与实现》读书笔记之进程地址空间

标签:

发布此文章仅为传递网友分享,不代表本站观点,若侵权请联系我们删除,本站将不对此承担任何责任。
Copyright ©2018  IT大杂烩  版权所有  京ICP备11030978号-1 网站地图