内存的使用和分段

多进程因为切换和阻塞，常常会改变实际地址，因此要有一种良好的寻址方式。

写程序时的内存地址有直接写实际地址，这常在嵌入式系统中使用。但在操作系统的环境中过于复杂，这样容易出问题。

因此我们使用逻辑地址，这方便我们写程序，但在实际内存中的地址应该如何得到呢？

一种方法是使用编译时重定位，但这也要在编译时知道空的内存空间，实现使用时和写实际地址差不多。

还有就是使用在载入时重定位，这给虽然解决了上面缺点，但载入后就无法改变了，只有第一次是动态加载，无法实时动态加载。

因此最好的方法是在运行时重定位，寻址方式：PCB中保存的基地址+逻辑地址。

既然使用了运行时重定位，那么不如将进程（程序）分段（编译时），如：

程序：	代码段	变量段	函数库	栈	堆

这样子将进程（程序）分段，增加了内存的灵活性和利用率，方便根据每个段的特性进行管理。

这时的寻址方式就变为：段基址+段内偏移。而PCB中就要记录各个段的基址——进程段表LDT（一般使用硬件寄存器LDTR配合载入段基址）。

LDT和GDT表是类似的，只不过GDT是整一个操作系统的表。GDT是操作系统的段表，LDT是每个进程的段表。

内存分区和分页

上面介绍了内存的使用，那么在使用之前就要确定，哪块内存是可以用的，这就需要内存管理了。

借鉴上面，管理的最好就是分区管理；最简单的管理方法就是固定分区，但这不灵活更不高效；因此需要采用动态分区。

动态分区内存管理不仅仅要能动态分配内存，并有记录使用情况的表，还有有释放内存的功能。

同时分配方法还多种多样：

首先适配：使用第一个找到的适配分区。（速度快）
最佳适配：最接近需求的分区。（内存碎片）
最差适配：最大的分区。（大分区数量少）

以上方法各有优点，但内存效率都比较一般，因此引出了分页，来解决内存分区导致的内存效率问题。

页就是将区在变小（如在linux0.11中4KB为1页）。虽然每页存在没用完的情况，但非常小（如在linux0.11中一定小于4KB），而分区可能会比较大。

同时我们将进程（程序）的分段再分为页存储，因此段表LGT要搭配逻辑页表和相关硬件（MMU内存管理单元和相关寄存器CR3）。页表是连续的即使中间某一页没有使用，这样可以是查找直接使用下面的方法：

页的寻址

总结上面内容就是：一个进程（程序）会被分为许多段，段又拆分为页。程序员访问该进程（程序）内存会访问段LDT，再通过段中页表访问实际地址。而实际内存是通过分页的内存映射表来管理内存。

多级页表和快表

分页虽然良好的解决了内存碎片，但分页后逻辑页表多又不能将没用的页表省去，这些表（主要是每个进程（程序）都有页表）就占用了不少空间（假设1个进程要10M页表，10个进程就要100M来存储了），为此有了多级页表，将页表占用空间减小。

多级页表，就好像目录。将内存分为多级页表，那些没用使用的内存，只要前几级页表就不再进行展开；而使用的内存就好像目录结果一样，一级一级展开。

多级分页

假设使用32位的地址的4GB内存空间，如果使用简单的分页，那么就需要1MB4（一个表项大小）=4MB空间。而假设如上图的多级分页，其中要用目录的3个项，那么一个表有1KB\4=4KB，一共有4个表（1个目录+3个页表）就是16KB，远小于4MB。

虽然良好的解决了内存问题，但也增加了访问速度（还是比不连续页表（折半查找）要快）。

为了提高多级页表的查找速度，就引入了快表。

多级分页像目录，那么快表就好像书签索引，记录了常用和最近使用的页号。

快表一般和硬件联合，使用寄存器组TLB一组相联快速存储（类比cache和主存）。

TLB

由于TLB是寄存器，所以其大小一般在[64,1024]KB。

内存管理

上面的人和应用希望用段，而物理内存希望用页，因此就将两种结合，段面向用户，页面向硬件。

从应用程序出发来看，程序的各个段需要地址，而这个段地址的虚拟的，要通过页来映射真实地址，我们将这个段地址的内存称为虚拟内存。

所以当用户访问内存时，先用段表映射地址得到虚拟内存地址，再通过虚拟地址根据页表映射得到物理地址。

因此虚拟内存就是操作系统将一个值给LDT，并没有真实地址。

虚拟内存

建立映射这里以fork函数流程举例：首先就是要分配虚拟内存给新进程LDT，然后就是分配内存建立新进程的页表。

下图是多进程访问内存：

读取例子

有了虚拟内存，能使用户就不需要时刻操心实际的物理情况，同时通过内存的换入和换出可以实现小内存变“大内存”。

小内存变“大内存”

内存换入

当通过映射发现当前访问的页不在页表中，就会产生中断调页。

采用请求调页而不是请求调段，原因是什么？请求调页的粒度更细,更能提高内存效率.

再中断中申请一个空闲页，从磁盘读入数据，建立两者映射。

内存换出

上面的中断中申请空闲页时并不能总是获得新的页，因为内存是有限的，所以要有换出操作。

换出主要就是算法的选择。假设页表一共有3个页框，页的读取顺序是ABCABDADBC。

FIFO

FIFO换出

采用先进先出的方式时，按上面的读取顺序，一个产生了7次换入换出。

MIN

选择将来最远才会再次使用的页淘汰。淘汰将来最远使用。

MIN换出

这时只有5次换入换出。但是我们怎么能知道将来发生什么呢？

LRU

既然用MIN我们不知道未来，那么根据代码的局部性，我们不如用历史来预测未来。淘汰最近最少使用。

LRU换出

在这个例子中基本和MIN的效果差不多。

那么如何获取使用情况呢：

时间戳：将最近一次使用的时间记录下来。

缺点：每次执行一条指令都要更改，代价太大。
页码栈：一个只有页表项个数（如上面就要3个）的栈，每次将使用和栈顶的页不同的页就压栈，栈如果是满的就丢弃栈底并下移一个，这时栈底是最不常用，栈顶反之。

缺点：和上面差不多

Clock

这时我们发现LRU完整的实现有点困难，因此将其简化为Clock算法，不再使用最近最少使用而是最近没有使用：

每个页有一个引用位，每次访问时硬件会将改为置1，要选择淘汰时，扫描改为，是1的重新置0，是0的淘汰。

这同样会产生一个问题，当缺页很少是，所有引用位都是1，这时会将所有1变成0，再将第一个变0的替换，不就变成了一种FIFO算法。

为了改善这一个问题，就需要定时间的将dshi所有引用位置0，这样能真正实现找出最近没有使用的。

这时定时置0就像分针，而缺页换出就像时针。

页框分配问题

上面的换入和换出都将调页，那么页表到底有多少页框（也叫做帧）比较好呢？分的多消耗资源，分的少就反复调页CPU利用率低。这时要用工作集算法（一种动态页面替换算法，前面的是静态的）。