Memory management dei processori i386 in protected mode - ... tuffiamoci nell'architettura Intel ...
Pubblicato da Ritz il 19/11/2000
Livello avanzato

Introduzione

--== LETTERATURA ==--
Molte delle info che trovate in questo tutorial sono state prese dai seguenti libri.
* "Volume 3: System Programming Guide", dell'"Intel Architecture Software Devloper's Manual", scaricabile dal sito della Intel nella sezione developer, Order Number 243192.
Anche i volumi 1 ("Basic Architecture", Order Number 243190) e 2 ("Instruction Set Reference Manual", Order Number 243191) di tale manuale possono tornare utili.
Per quanto riguarda le tabelle, invece, esse sono state spudoratamente copiate dai testi sopra citati :).

--== INTRO ==--
Salve a tutti.
Come penso avrete gia' capito questo tutorial non avra', come solitamente accade, una scopo pratico, bensi' il suo unico proposito e' quello di spiegare il funzionamento in protected mode dei processori i386.
Parlero' delle tavole di descrittori, dei meccanismi di paginazione e segmentazione, di exception handling, and so on. Ad ogni modo, in alcuni ambiti queste informazioni possono cmq risultare utili, come ad esempio nel caso si desideri scendere a ring0 da win9x.
Nonostante questo, non daro' esempi pratici di come ottenere cio', sia perche' cosi' vi divertire un po' a farlo da soli (evabbe' sono bastardo lo so ;) ), ma soprattutto perche', visto che questo tutorial e' soprattutto per il RACL (http://racl.oltrelinux.com) non mi pare il caso di soffermi su sistemi della M$.
Ecco quindi che cerchero' di essere il + generale possibile.
Tanto per fare un esempio per chiarire come alcuni aspetti siano applicabili solo in ambienti specifici, se sotto win potete scendere a ring0 semplicemente utilizzando metodi quali call gate, int gate e cosi' via perche' gdt, ldt e idt (spieghero' tutto sotto) sono modificabili a ring3 (se volete sull'asj 1 trovate il relativo tute), in Linux cio' non e' possibile perche' essendo quest'ultimo un SO serio e sicuro non mette tali strutture in pagine a ring3 ma le protegge da eventuali modifiche.
Detto questo, let's start!

Iniziamo

--== MEMORY MANAGEMENT NELLE ARCHITETTURE i386 ==--

Come tutti probabilmente saprete, lo stato nativo di un i386 e' il protected mode. Le principali caratteristiche di tale tipo di memory management sono 2: segmentazione e paging.

PAGING
Tramite il paging si ha la possiblilta' di eseguire un dato processo utilizzando un sistema di "memoria virtuale" in cui le varie parti in cui viene diviso il programma (chiamate pagine, che solitamente sono di 4KB) vegnono mappate nella memoria fisica solo quando ce n'e' effettivamente bisogno. Tale meccanismo puo' essere cmq disattivato.

Il paging e' controllato da 3 flag nei registri di controllo:

1- Il bit 31 di CR0 (flag PG). Questo flag e' responsabile dell'utilizzo della paginazione e viene settato solitamente dal SO durante l'inizializzazione.
2- Il bit 4 di CR4 (flag PSE, page flag extension). Questo flag serve a specificare l'utilizzo di pagine di 4MB o 2 MB (se il flag PAE e' settato). Se tale flag e' spento, viene utilizzata per le pagine la classica grandezza di 4KB.
3- Il bit 5 di CR4 (flag PAE, physical address extension). Questo bit permette di utilizzare indirizzi fisici di 36bit al posto dei comuni 32bit. Ne parlero' + avanti.

Se e' attivata la paginazione, il processore per poter ricavare l'indirizzo fisico di memoria partendo da quello lineare deve utilizzare alcune strutture, ovvero

. Page directory: un array di PDE (page-directory entries) contenute in una pagina di 4KB. Una page dir puo' contenere fuino a 1024 entry
. Page table: un array di PTE (page-table entries) contenute in una pagina di 4KB. Una page table puo' contenere fino a 1024 entry. NOTA: le page table non sono usate per pagine di 4 o 2 MB.
. Page: la pagina fisica:).
. Page-Directory-Pointer Table: un array di entry a 64-bit ognuna delle qualli punta a una page dir. Questa struttura non e' usata se si sta utilizzando il phys. addr. extension.

Senza spiegare tutte le situazioni in cui si puo' capitare faccio di seguito uno schemino che sicuramente sara' + esplicativo delle parole.

 +---------+----------+----------+---------+------+---------------+
 | Flag PG | PAE Flag | PSE Flag | PS Flag | Page |   Physical    |
 |   CR0   |   CR4    |   PDE    |   PDE   | Size | Address Space |
 +---------+----------+----------+---------+------+---------------+
 |    0    |     x    |     x    |    x    |   /  |Paging Disabled|
 +---------+----------+----------+---------+------+---------------+
 |    1    |     0    |     0    |    x    | 4 KB |     32 bit    |
 +---------+----------+----------+---------+------+---------------+
 |    1    |     0    |     1    |    0    | 4 KB |     32 bit    |
 +---------+----------+----------+---------+------+---------------+
 |    1    |     0    |     1    |    1    | 4 MB |     32 bit    |
 +---------+----------+----------+---------+------+---------------+
 |    1    |     1    |     x    |    0    | 4 KB |     36 bit    |
 +---------+----------+----------+---------+------+---------------+
 |    1    |     1    |     x    |    1    | 2 MB |     36 bit    |
 +---------+----------+----------+---------+------+---------------+
Ma cosa accade una volta che, attivato il paging, si vuole ricavare un indirizzo fisico da uno lineare? Se le pagine utilizzate sono di 4KB, il linear address si presenta cosi':
  31      22 21      12 11         0 
 +----------+----------+------------+
 | Directory|  Table   |   Offset   |
 +----------+----------+------------+
L'entry "Directory" offre un offset ad un'entry nella page dir. Tale entry dara' poi il base physical address della page table.
Tramite l'entry Table viene fornito un offset a un'entry nella page table selezionata: tale entry a sua volta dara' il base physical address di una pagina nella memoria fisica.
Il campo Offset, a sua volta, dara' un'offset all'indirizzo fisico nella pagina.

In altri termini, tramite i bit 22 -> 31 viene ricavata un'entry nella page dir che servira' a trovare il base phys. address della page table. Tramite i bit 12 -> 21 verra' poi selezionata un'entry di tale page table, da cui sara' ricavato il base phys address della pagina in questione. Tramite il campo "offset" (relativo al base phys address della pagina) verra' poi ricavato l'indirizzo fisico corrispondente a quello lineare di partenza.

Se la pagina invece che di 4KB e' di 4MB, allora il linear address conterra' solo un campo "offset" (bit 0 -> 21) e un campo "Directory" (bit 22 -> 31). il secondo dara' un offset a un'entry nella pagedir, da cui verra' ricavato il base phys address della pagina, mentre il primo offrira' un offset all'interno di tale pagina.

Ecco di seguito come si presenta un'entry nella Page Dir quando si utilizzano pagine di 4KB (naturalmente disegno non in scala;) ).
  31                     12 11  9  8   7   6   5   4   3   2   1   0  
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+
 |                         |     |   |   |   |   | P | P | U | R |   |
 | Page-Table Base Address |Avail| G | PS| 0 | A | C | W | / | / | P |
 |                         |     |   |   |   |   | D | T | S | W |   |
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+
Ora un disegnino pure delle Page Table entry con pagine a 4KB.
  31                     12 11 9   8   7   6   5   4   3   2   1   0  
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+
 |                         |     |   |   |   |   | P | P | U | R |   |
 | Page-Table Base Address |Avail| G | 0 | D | A | C | W | / | / | P |
 |                         |     |   |   |   |   | D | T | S | W |   |
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+
Ora un altro disegnino di una Page Dir entry con pagine a 4MB.
  31          22 21      12 11  9  8   7   6   5   4   3   2   1   0  
 +--------------+----------+-----+---+---+---+---+---+---+---+---+---+
 |      Page    |          |     |   |   |   |   | P | P | U | R |   |
 |      Base    | Reserved |Avail| G | PS| D | A | C | W | / | / | P |
 |    Address   |          |     |   |   |   |   | D | T | S | W |   |
 +--------------+----------+-----+---+---+---+---+---+---+---+---+---+
E ora la spiegazione dei relativi campi e flag + importanti (non li metto proprio tutti).

* Page base address, bit 12 --> 32 (o 22 --> 32, a seconda della grandezza della pagina)
E' l'indirizzo fisico del primo byte di una pagina o di una page table.

* P (present) flag, bit 0
Indica se la pagina e' caricata in memoria (settato) o meno (non settato). Se si vuole acccedere a una pagina non in memoria, accade il solito e comune #PF (page-fault exception).

* R/W (Read/Write) flag, bit 1
Indica se la pagina e' solamente readable (non settato) o anche writeable (settato). Questo flag interagisce coi flag U/S e WP nel CR0.

* U/S (User/Supervisor) flag, bit 2
Indica il privilegio user/supervisor. Se non e' settato la pagina (o il gruppo di pagine) e' assegnata al livello supervisor, altrimenti al livello user. Tale flag interaisce con i flag R/W e WP in CR0.

* A (Accessed) flag, bit 5
Indica se vi e' stato un accesso alla pagina a alla page table.

* D (Dirty) flag, bit 6
Indica, se settato, che la pagina e' stata scritta.

* PS (Page Size) flag, bit 7
Determina la grandezza della pagina (usato solo nelle entry della page- dir). Se e' spento, la size e' 4KB e la page dir entry punta a una e'age table. Se e' acceso, la size e' 4MB per l'indirizzamento a 32bit (e 2MBse e' attiato l'indirizzamento esteso) e la page dir entry punta a una pagina. Se tale entry punta a una page table, tutte le pagine associate con quella table saranno di 4KB.

* G (Global) flag, bit 8
[Dai Pentium Pro] Indica una global page. Questo flag viene usato specialmente per evitare che le pagine + usate siano cancellate dai TLB.

Cosa sono questi TLB? Il TLB (Translation Lookaside Buffer) sono delle cache on- chip dove il processore conserva le pagine utilizzate + recentemente. La famiglia P6 e Pentium ha separati TLB per cache di dati e istruzioni. Inoltre, i P6 hanno TLB separati per pagine a 4KB e 4MB.

La maggior parte del meccanismo di paging, in effetti, e' svolta tuilizzando i TLB, per risparmiare cicli di bus alla page dir e page table, che vengono effettivamente eseguiti solo se i TLB non contengono i dati di traduzione richiesti per una pagina.
I TLB sono naturalmente modificabili solo a ring0.

Per il resto non mi dilungo oltre sull'argomento, puo' bastare sapere questo sui TLB.

Physical Address Extension
Quando il physical address extension viene attivato, vengono apportati questi cambiamenti nelle strutture inerenti al paging.

  31 30 29     21 20      12 11         0 
 +-----+---------+----------+------------+
 |     |Directory|  Table   |   Offset   |
 +-----+---------+----------+------------+
    ^
    |
    +---------- Directory Pointer
Per tradurre un indirizzo lineare in uno fisico con pagine da 4 KB, vengono utilizzati i bit 30 e 31 della entry Page-dir-pointer-table per ricavare una delle 4 entry nella page-dir-pointer table. Tale entry dara' il base address fisico di una page dir. A questo verra' aggiunto l'offset specificato nel campo "Page directory entry" (bit 21 -> 29) dell'indirrizzo lineare, in modo da ricavare un'entry nella page dir selezionata. Da qui verra' ottenuto i base address fisico di una page table.
A tale indirizzo si aggiungera' ancora l'offset specificato nel campo "Page- entry table" (bit 12 -> 20) sempre del linear address. In tal modo si ottiene il base physical address di una pagina nella memoria fisica. Bastera' aggiungere a tale valore l'offset specificato nel campo "Page offset" (bit 0 -> 11) per formare finalmente l'indirizzo fisico corrispondente a quello lineare di partenza. Effettivamente e' un po' un casino.
Se invece la pagina e' i 2MB, viene ricavato il base address della page dir, si aggiunge un offset per ricavare il base address di una pagina e a questo viene ancora aggiunto un offset per ricavare l'indirizzo tradotto.
Vi metto di seguito gli schemi di alcune entry (nel caso di indirizzamenti a 36bit), che diligentemente NON commentero' visto che ne ho gia' spiegato la funzione.
                  Page-Directory-Pointer-Table Entry

  63                                               36 35           32 
 +---------------------------------------------------+---------------+
 |                                                   |               |
 |                Reserved (set to 0)                |  Base Address |
 |                                                   |               |
 +---------------------------------------------------+---------------+

  31                     12 11  9 8             5  4   3  2     1  0  
 +-------------------------+-----+---------------+---+---+-------+---+
 |                         |     |               | P | P |       |   |
 |Page-Directory Basse Addr|Avail|   Reserved    | C | W |  Res  | 1 |
 |                         |     |               | D | T |       |   |
 +-------------------------+-----+---------------+---+---+-------+---+


                 Page-Directory Entry (4KB Page Table)

  63                                               36 35           32 
 +---------------------------------------------------+---------------+
 |                                                   |               |
 |                Reserved (set to 0)                |  Base Address |
 |                                                   |               |
 +---------------------------------------------------+---------------+

  31                     12 11  9  8   7   6   5   4   3   2   1   0  
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+
 |                         |     |   |   |   |   | P | P | U | R |   |
 |Page-Directory Basse Addr|Avail| 0 | 0 | 0 | A | C | W | / | / | P |
 |                         |     |   |   |   |   | D | T | S | W |   |
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+


                   Page-Table Entry (4KB Page Table)

  63                                               36 35           32 
 +---------------------------------------------------+---------------+
 |                                                   |               |
 |                Reserved (set to 0)                |  Base Address |
 |                                                   |               |
 +---------------------------------------------------+---------------+

  31                     12 11  9  8   7   6   5   4   3   2   1   0  
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+
 |                         |     |   |   |   |   | P | P | U | R |   |
 |Page-Directory Basse Addr|Avail| G | 0 | D | A | C | W | / | / | P |
 |                         |     |   |   |   |   | D | T | S | W |   |
 +-------------------------+-----+---+---+---+---+---+---+---+---+---+


                  Page-Directory-Pointer-Table Entry

  63                                               36 35           32 
 +---------------------------------------------------+---------------+
 |                                                   |               |
 |                Reserved (set to 0)                |  Base Address |
 |                                                   |               |
 +---------------------------------------------------+---------------+

  31                     12 11  9 8             5  4   3  2     1  0  
 +-------------------------+-----+---------------+---+---+-------+---+
 |                         |     |               | P | P |       |   |
 |Page-Directory Basse Addr|Avail|   Reserved    | C | W |  Res  | 1 |
 |                         |     |               | D | T |       |   |
 +-------------------------+-----+---------------+---+---+-------+---+


                 Page-Directory Entry (2MB Page Table)

  63                                               36 35           32 
 +---------------------------------------------------+---------------+
 |                                                   |               |
 |                Reserved (set to 0)                |  Base Address |
 |                                                   |               |
 +---------------------------------------------------+---------------+

  31       21 20         12 11  9  8   7   6   5   4   3   2   1   0  
 +-----------+-------------+-----+---+---+---+---+---+---+---+---+---+
 |    Page   |             |     |   |   |   |   | P | P | U | R |   |
 |    Base   | Reserved (0)|Avail| G | 1 | D | A | C | W | / | / | P |
 |   Address |             |     |   |   |   |   | D | T | S | W |   |
 +-----------+-------------+-----+---+---+---+---+---+---+---+---+---+
Nel caso di pagine a 2MB la page dir pointer table entry e' identica a quella per pagine a 4KB.

SEGMENTATION
Il meccanismo della segmentazione, invece, consente di dividere lo spazio di memoria indirizzabile, ovvero quello lineare, in spazi di indirizzamento piu' piccoli, chiamati segmenti. Ogni segmento puo' esser usato per contenere codice, dati o stack di un programma o per contenere strutture quali LDT. La segmentazione, al contrario del paging, *non* puo' essere disattivata.
Di conseguenza, affinche' un dato processo possa accedere a un byte in un dato spazio di memoria (contenuto nel linear address space) deve fornire al processore un indirizzo logico, composto a un segment selector (un selettore di 16 bit) e un offset di 32 bit.
Il selettore e' un identificatore *unico* per ogni segmento, che oltre ad altre cose consiste in un offset che punta ad un dato descrittore (sempre caratteristico di quel segmento) all'interno della GDT (Global Descriptor Table, Tavola dei Descrittori Globale). Il compito del processore e' quello, dato un selettore, di individuare il corrispondente descrittore nella GDT e da esso ricavare il base address del segmento corrispondente. Aggiungendo al base address del segmento l'offset indicato nell'indirizzo logico si ricavera' l'indirizzo lineare a cui si vuole accedere.
Schematicamente,

 +INDIRIZZO LOGICO+---->(del tipo 1234:12345678, ad ex CS:EIP o DS:ESI)
 +---------+------+
  SELETTORE OFFSET
      |        |                      +-----+
      |        +--------------------->|  +  |-------> INDIRIZZO LINEARE nel 
Linear Address Space
      |                               +-----+         ^^^^^^^^^^^^^^^^^
      |                                  ^
      |                                  | 
      |     +-------+                    |
      +---->|  GDT  |----- BASE ADDRESS -+
            +-------+      ^^^^^^^^^^^^
Lo schemino e' molto semplice (a dire il vero pensavo mi venisse peggio;P ) e non fa alcun riferimento a meccanismi quali paging che dall'indirizzo lineare ricavano quello fisico in cui la pagina e' stata mappata, btw a noi cio' non interessa visto che ne abbiamo gia' parlato:).
La segmentazione cmq e' un meccanismo generale, e ogni sistema la puo' implementare nel modo che piu' piace agli sviluppatori, a seconda del numero di segmenti che si desiderano utilizzare. Alcuni tipi di modelli utilizzati sono il Basic Flat Model, Protected Flat Model e Multisegment Model.
Nel primo caso lo spazio indirizzabile e' continuo e non segmentato, ad ogni modo almeno due descrittori (un code e un data) devono essere creati, anche se essi vengono cmq mappati all'interno del linear address space con lo stesso base address (0) e lo stesso limite (4GB).
Il secondo caso, invece, il Protected Flat Model, e' molto simile al Basic Flat ma con la differenza che e' garantita un minimo di protezione (ad ex se si cerca di accedere a della memoria inesistente superandone il limite viene generata una general-protection fault) e i limiti dei segmenti vengono settati; la maggior parte dei sistemi operativi multitasking utilizza proprio questo modello.
Nel terzo caso, invece, ogni programma ha la propria tabella di descrittori e i propri segmenti a seconda che si abbia a che fare con codice, dati, stack o altro. Tale modello offre naturalmente la maggior protezione possibilie.
Analizziamo ora le strutture quali selettori e descrittori.
Un segment selector si presenta cosi' (scusate la pessima grafica ASCII ma l'ho dovuta fare sempre io;) ).
  15                                               3   2  1     0
 +--------------------------------------------------+----+-------+
 |                                                  |    |       |
 |                      Index                       | TI | R P L |
 |                                                  |    |       |
 +--------------------------------------------------+----+-------+
* Index, bit 3 --> 15
Seleziona uno degli 8192 descriptor nella GDT o LDT. Il processore moltiplica tale valore per 8 (il numero di byte di un descriptor) e lo aggiunge al base address della GDT / LDT (ricavato dai registri GDTR o LDTR).
* TI (Table Indicator) flag, bit 2
Specifica quale descriptor table usare: 1 = LDT, 0 = GDT * RPL (Requested Privilege Level), bit 0 --> 1
Bit importanti per noi, specificano il livello di privlegio del selettore, che puo' variare da 0 a 3 come ben sappiamo;).
Per poter risparmiare tempo e cicli di clock nel calcolo degli indirizzi il processore offre 6 registri di segmento addetti appunto a contenere un segment selector (ogni registro cmq supporta un solo specifico tipo di selettore, per codice, dati, stack etc). In realta' i registri di segmento sono costituiti, oltre al selettore di 16 bit, da un'altra porzione che serve a risparmiare cicli di clock sempre nella traduzione di indirizzi, che cmq a noi non interessa.
Un segment descriptor, invece, e' una strutura nella GDT o LDT che serve al processore per determinare posizione e grandezza di un segmento. Eccone una rappresentazione.
  31            24 23 22 21 20 19   16 15 1413 12 11     8 7             0
 +----------------+--+--+--+--+-------+--+----+--+--------+---------------+
 |                |  | D|  | A|  Seg  |  | D  |  |        |               |
 |   Base 31:24   | G| /| 0| L| Limit | P|  P | S|  Type  |   Base 23:16  |
 |                |  | B|  | V| 19:16 |  |   L|  |        |               |
 +----------------+--+--+--+--+-------+--+----+--+--------+---------------+

  31                                16 15                                 0
 +------------------------------------+------------------------------------+
 |                                    |                                    |
 |         Base Address 15:00         |         Segment Limit 15:00        |
 |                                    |                                    |
 +------------------------------------+------------------------------------+
* Segment Limit field, bit 0 --> 15 (1a dw) + 16 --> 19 (2a dw)
Indica la grandezza del segmento (il processore mette insieme i 2 campi per formare un valore di 20 bit). Se il flag G di granularita' non e' settato, la grandezza puo' variare a 1 byte a 1MB, se e' settato puo' variare da 4 KB a 4GB con incrementi di 4KB alla volta.
* Base Address field, bit 16 --> 31 (1a dw) + 0 --> 7 (2a dw) + 24 --> 31 (2a dw)
Indica la posizione del byte 0 del segmento all'interno del linear address space di 4GB (il processore mette insieme i 3 campi per fromare un valore a 32bit).
* Type field, bit 8 --> 11 (2a dw)
Indica il tipo di segmento, i tipi di accesso su di esso e la sua direzione di sviluppo.
* S (descriptor type) flag, bit 12 (2a dw)
Indica se abbiamo a che fare con un system segment (S non e' acceso) e un code / data segment (S e' acceso) * DPL (descriptor privilege level) field, bit 13 --> 14 (2a dw)
Altro campo importante per noi: indica il livello di privilegio del segmento (4 valori da 0 a 3).
* P (segment present) flag, bit 15 (2a dw)
Indica se il segmento e' presente (acceso) o no (spento) in memoria. Se, da spento, si carica un segment register con un selettore che punta ad esso, viene generata un'exception segment-not-present (#NP). Inoltre, se tale flag non e' settato, il formato del descrittore stesso cambia.
* D/B (default operation size/default stack pointer size and/or upper bound) flag, bit 22 (2a dw)
Tale flag ha differenti funzioni (che non analizzeremo) a seconda che il segmento sia un code segment, expand-down data segment e stack segment.
* G (granularity) flag, bit 23 (2a dw)
Determina la scala di aumento del segment limit. Se non e' settato il limite e' interpretato in unita' di byte, in caso contrario in unita' di 4KB.
Il bit 20 della seconda dw e' disponibile per il software, il bit 21 e' riservato e dovrebbe esser sempre lasciato a 0.
Nel caso in cui il flag S sia settato, il descriptor puo' riferirsi a segmento di codice o dati. E' il bit 11 della seconda dw del descriptor (il bit piu' significativo del type field) a determinare quando il descriptor stesso sia per segmenti di codice o dati.
Per i data segment, i 3 bit meno significativi indicano quando il segmento sia accessed (A), se si puo' scrivere su di esso (W) e la direzione di espansione (E).
Per i code segment, tali 3 bit stanno ad indicare quando il segmento e' accessed (A), se lo si puo' leggere (R) e se e' conforming (C). Sul significato di "conforming" parlero' in seguito.
 +-----------------+------------------+-----------------------------------------+
 |   Type Field    |                  |                                         |
 +----+----+---+---+    Descriptor    |                                         |
 | 11 | 10 | 9 | 8 |       Type       |               Description               |
 |    |  E | W | A |                  |                                         |
 +----+----+---+---+------------------+-----------------------------------------+
 |  0 |  0 | 0 | 0 |       Data       | Read-Only                               |
 |  0 |  0 | 0 | 1 |       Data       | Read-Only, accessed                     |
 |  0 |  0 | 1 | 0 |       Data       | Read/Write                              |
 |  0 |  0 | 1 | 1 |       Data       | Read/Write, accessed                    |
 |  0 |  1 | 0 | 0 |       Data       | Read-Only, expand-down                  |
 |  0 |  1 | 0 | 1 |       Data       | Read-Only, expand down, accessed        |
 |  0 |  1 | 1 | 0 |       Data       | Read/Write, expand-down                 |
 |  0 |  1 | 1 | 1 |       Data       | Read/Write, expand-down, accessed       |
 +----+----+---+---+------------------+-----------------------------------------+
 |    |  C | R | A |                  |                                         |
 +----+----+---+---+------------------+-----------------------------------------+
 |  1 |  0 | 0 | 0 |       Code       | Execute-Only                            |
 |  1 |  0 | 0 | 1 |       Code       | Execute-Only, accessed                  |
 |  1 |  0 | 1 | 0 |       Code       | Execute/Read                            |
 |  1 |  0 | 1 | 1 |       Code       | Execute/Read, accessed                  |
 |  1 |  1 | 0 | 0 |       Code       | Execute-Only, conforming                |
 |  1 |  1 | 0 | 1 |       Code       | Execute-Only, conforming, accessed      |
 |  1 |  1 | 1 | 0 |       Code       | Execute/Read-Only, conforming           |
 |  1 |  1 | 1 | 1 |       Code       | Execute/Read-Only, conforming, accessed |
 +----+----+---+---+------------------+-----------------------------------------+
Quando invece l'S flag non e' settato, il descrittore e' di tipo system. Ecco di seguito alcuni tipi di descrittori di sistema.
Questi tipi di descrittori sono raggruppati inoltre in system-segment descriptor e gate descriptor. I primi puntano a segmenti di sistema quali LDT e TSS, mentre i secondi sono dei gate che contengono puntatori a procedure nei segmenti di codice (in altri termini call, interrupt etc) o che contengono selettori per la TSS. Ecco di seguito la tabella precedente che pero' si riferisce ai system descriptor.
 
 +-----------------+-----------------------+
 |   Type field    |                       |
 +----+----+---+---+      Description      |
 | 11 | 10 | 9 | 8 |                       |
 +----+----+---+---+-----------------------+
 |  0 |  0 | 0 | 0 | Reserved              |
 |  0 |  0 | 0 | 1 | 16-bit TSS (Avaiable) |
 |  0 |  0 | 1 | 0 | LDT                   |
 |  0 |  0 | 1 | 1 | 16-bit TSS (Busy)     |
 |  0 |  1 | 0 | 0 | 16-bit Call Gate      |
 |  0 |  1 | 0 | 1 | Task Gate             |
 |  0 |  1 | 1 | 0 | 16-Bit Interrupt Gate |
 |  0 |  1 | 1 | 1 | 16-bit Trap Gate      |
 |  1 |  0 | 0 | 0 | Reserved              |
 |  1 |  0 | 0 | 1 | 32-bit TSS (Avaiable) |
 |  1 |  0 | 1 | 0 | Reserved              |
 |  1 |  0 | 1 | 1 | 32-bit TSS (Busy)     |
 |  1 |  1 | 0 | 0 | 32-bit Call Gate      |
 |  1 |  1 | 0 | 1 | Reserved              |
 |  1 |  1 | 1 | 0 | 32-bit Interrupt Gate |
 |  1 |  1 | 1 | 1 | 32-bit Trap Gate      |
 +----+----+---+---+-----------------------+

--== MECCANISMI DI PROTEZIONE IN PROTECTED MODE ==--
Ogni volta che in una qualsiasi situazione avviene un riferimento alla memoria i processori i386 eseguono svariati check di vario tipo in parallelo con la traduzione degli indirizzi (senza quindi che ci sia perdita di cicli). Tali check si dividono in:

Ogni violazione a una protezione da' come risultato un'exception.
Qui mi soffermero' sul terzo tipo di check.
Non penso sia il caso di dirlo, btw il meccanismo di protezione dei segmenti riconosce 4 diversi livelli di privilegio, numerati da 0 a 3; tali livelli possono essere interpretati come anelli di protezione (da qui il nome ring livel), dove nel ring0 c'e' il kernel del SO, nei ring1 e ring2 ci sono i servizi di sistema, nel ring3 ci sono le comuni applicazioni. A ring0 si puo' fare tutto cio' che si vuole sul processore e utilizzare *tutto* il set di isctruzioni disponibili. Se si tenta di eseguire a ring3 istruzioni eseguibili solo a ring0 si incorrera' in una general-protection exception (#GP).
Affinche' il Privilege Level check sia eseguito, il processore deve esaminare tutti i seguenti tipi di livelli di privilegio:
# Current Privilege Level (CPL) Il CPL, il cui valore e' contenuto nei bit 0 e 1 nei registri di segmento CS e SS, indica il livello di privilegio del programma/task attualmente in esecuzione. Di solito (ma non sempre, come vedremo dopo) il CPL e' uguale al livello di privilegio del code segment da cui sono prese le istruzioni. Il processore cambia il CPL quanto il controllo e' trasferito a un segmento con differente livello di privilegio.
# Descriptor Privilege Level (DPL) Il DPL e' il livello di privilegio di un segmento (o un gate). Il suo valore e' contenuto nel campo DPL del descrittore del segmento (o del gate).
# Requested Privilege Level (RPL) L'RPL e' un livelo di privilegio assegnato ai selettori di segmento.Il suo valore e' contenuto nei bit 0 e 1 del selettore stesso.

Privilege Level Checking in riferimento ai data segment
Per accedere ai dati di un data segment, e' necessario spostare in un registo di segmento per dati (DS, ES, FS e GS) un selettore per il segmento a cui si desidera accedere.
Prima che il processore carichi tale valore nei registri di segmento, pero', attua un privilege level check che consiste in questo: vengono confrontati il CPL, l'RPL del selettore e il DPL del descrittore del segmento. Affinche' il processore carichi nel registri di segmento il selettore, il DPL dele essere maggiore o uguale sia al CPL che all'RPL; in caso contrario, #GP rulez;).
Per quanto riguarda gli stack segment, invece, affinche' il registro SS venga caricato con il selettore indicato sia l'RPl dello stack segment selector che il DPL dello stack segment descriptor devono essere uguali al CPL. Lascio a voi indovinare cosa accade in caso contrario;).

Privilege Level Checking nel trasferimento del controllo del programma tra code segment
Quando il controllo del prg in esecuzione viene passato da un segmento a un altro, il selettore per il codice di destinazione deve esser caricato nel registro CS. Il processore pero' carica tale selettore solo dopo aver fatto sul descrittore a cui esso si riferisce check di tipo, di limite e di *privilegio*. Se tali check hanno successo, l'esecuzione sara' passata al nuovo segmento, precisamente all'indirizzo CS:EIP.
Per poter trasferire il contorllo a un segmento diffrente da quello attuale si utilizzano le classiche istruzioni del tipo JMP/CALL, ma le strade che si possono seguire sono piu' di una:
Caso #1 - Trasferimento diretto al segmento a cui si vuole accedere.
Caso #2 - Utilizzo di un gate descriptor che contiene il selettore per il code segment a cui si desidera ccedere.
Caso #3 - Trasferimento al TSS, che contiene il selettore per il segmento target.
Caso #1
Se si desidera trasferire il controllo del programma a un segmento diverso da quello attuale una strada e' quella di esegure un far JMP/CALL alla procedura desiderata. naturalmente, *prima* di eseguire tale salto o tale call si eseguono dei controlli di privilegio. In questo caso, vengono controllati:
- Il CPL.
- Il DPL per il segmento target.
- L'RPL.
- Il C flag nel descrittore del target code segment, che determina se il segmento e' conforming o non-conforming.
Se il segmento e' nonconforming (e la maggioranza lo sono), il CPL (naturalmente sempre della procedura chiamante) deve essere uguale alla DPL del segmento di destinazione. In caso contrario, #GP. Avrete gia' capito che allora questo non puo' essere un modo per scendere a ring0 da ring3.
Se il segmento e' conforming, il CPL deve essre uguale o maggiore (ovvero aver meno livello di privilegio) del DPL del segmento target, e l'RPL del selettore del segmento target non e' controllato. Se il check ha esito positivo, in CS viene caricato il selettore, altrimenti solito #GP.
In altre parole, per i conforming code segment la DPL rappresenta il livello di privilegio piu' basso a cui puo' essere la procedura chiamante affinche' possa essere eseguita con successo una call al code segment target.
A questo punto sembrerebbe che utilizzando segmenti conforming e settanto la DPL del descrittore che si riferisce al segmento target a 0 si possa scendere molto facilmente a ring0... ma c'e' un problema, infatti quei simpaticoni della Intel hanno fatto in modo che, anche se in questo tipo di procedura la DPL e' 0 o cmq < CPL, quando il selettore e' caricato in CS il CPL rimanga invariato e non scenda al valore della DPL, questo per questioni di protezione tra segmenti conforming e nonconforming (che solitamente sono utilizzati da moduli quali math library)... bella sfiga per noi, visto anche che questo e' l'unico caso, come accennato sopra, in cui CPL != DPL del code segment corrente.
In definitiva, se vogliamo scendere a ring0 su un processore Intel possiamo sognarci di fare un JMP/CALL diretto al codice che codice che ci interessa. Fuori 1.
Caso #2
Per permettere a un programma di vere accesso a segmenti con livelli di privilegio tra loro differenti le <Architetture i386 mettono a disposizione un set particolare di descrittori, chiamati gate descriptor. Ne esistono 4 tipi: - Call gate.
- Trap gate.
- Interrupt Gate.
- Task Gate.
I Call Gate sono stati progettati proprio per permettere lo switching tra segmenti dal livello di privilegio diverso o tra segmenti a 16 e 32 bit.
Essi possono essere installati nella GDT o nella LDT, *non* nella IDT, e il suo compito e' quello di:
1- Specificare il segmento a cui accedere.
2- Definire un entrypoint per la procedura nel segmento target.
3- Specificare il livello di privilegio che la procedura chiamante deve avere per poter accedere alla nuova procedura.
4- Specificare il numero di parametri da cpiare tra gli stack se accade uno stack-switch.
5- Definire la grandezza dei valori da pushare nello stack target (16 bit segment = push a 16 bit, 32 bit segment = push a 32 bit).
6- Specificare in quali casi il call gate e' valido.
Ecco come si presenta un call gate.

  31                                 16 15 1413 12 11     8 7 6 5 4        0 
 +-------------------------------------+--+----+--+--------+-----+----------+
 |                                     |  | D  |  |  Type  |     |          |
 |       Offset in Segment 31:16       | P|  P | 0|        |0 0 0| Parameter|
 |                                     |  |   L|  |1|1|0|0 |     |  Count   |
 +-------------------------------------+--+----+--+-+-+-+--+-----+----------+

  31                                16 15                                  0 
 +------------------------------------+-------------------------------------+
 |                                    |                                     |
 |          Segment Selector          |       Offset in Segment 15:00       |
 |                                    |                                     |
 +------------------------------------+-------------------------------------+
Il campo "Segment Selector" specifica il segmento a cui accedere. Il campo "Offset" specifica l'entrypoint nel segmento. Il DPL specifica il livello di privilegio del call gate, ovvero il livello di privilegio necessario per accedere al segmento attraverso il call gate. Il P flag indica se il descrittore e' valido (ovvero e' il flag P che indica se il segmento effettivamente esiste). Il campo "Parameter Count" indica il numero di parametri da copiare dallo stack della procedura chiamante a quello della nuova procedura se avviene uno stack- switch (ovvero il numero di word per il call gate a 16 bit o il numero di dw per il call gate a 32 bit).
Per accedere al call gate si dovra' utilizzare un far operand in un JMP o una CALL: il selettore identifica il call gate, mentre come offset si puo' mettere cio' che si preferisce, tanto non viene ne' controllato ne' usato.
Una volta che il processore ha avuto accesso al call gate, utilizza il selettore per trovare il descrittore per il segmento target, che puo' trovarsi nella GDT o nella LDT. Quindi somma al base address del segmento (ricavato dal descrittore) all'offset nella call gate per formare l'indirizzo lineare dell'entrypoint della procedura nel segmento. Per ocntrollare la validita' del trasferimento del controllo all'interno del prg attraverso un call gate vengono controllati:
- la CPL.
- La RPL del selettore al call gate.
- La DPL del decrittore a cui il call gate si riferisce.
- La DPL del descrittore del segmento target.
- Il C flag nel descrittore per il segmento target.
Le regole che determinano la validita' o meno del trasferimento variano a seconda che esso avvenga tramite una CALL o un JMP.
Se abbiamo a che fare con una CALL,
a- Il CPL deve essere minore o uguale al DPL del call gate.
b- L'RPL del selettore al call gate deve essere minore o uguale al DPL del call gate.
c- Il DPL del descrittore per il segmento target deve essere minore o uguale al CPL, sia che il segmento sia conforming che nonconforming.
Per i JMP valgono le stesse regole con l'eccezione che, al punto c, se il segmento target e' conforming il suo DPL deve essere minore o uguale al CPL, mentre se e' nonconforming deve essere uguale al CPL.
Tutte tali regole sono btw piu' facili da capire che da spiegare;).

Stack Switching
Quando un programma utilizza un call gate per traserire il controllo da un segmento meno privilegiato a uno piu' priviligiato il processore automaticamente cambia (switcha, appunto;) ) il task utilizzato. Cosa significa tutto cio? Nelle architetture Intel per ogni task in esecuzione esistono 4 stack: 1 per l'attuale livello di privilegio (ring3) e altri 3 per i rimanenti livelli ring2, ring1 e ring0 (naturalmente per i sistemi che utilizzano sono 2 livelli ring3 e ring0 quali WinCesso esistono solo 2 stack), ognuno naturalmente presente in un proprio segmento separato. Quando da un livelo meno privilegiato si scende a uno piu' privilegiato (anche se usando questi termini sarebbe piu' opportuno dire "si sale" a dire il vero ;) ) viene effettuato proprio un cambiamento del task utilizzato (task switching) che in primo luogo permette alle procedure piu' privilegiate di avere un minor rischio di crash a causa di uno stack troppo piccolo e in secondo luogo impedisce che le procedure a ring piu' alto (meno privilegiate) interferiscano con quelle a ring piu' basso a causa di uno stack condiviso (shared stack).
Come noto per puntare allo stack servono un selettore e uno stack pointer. Quando siamo a ring3, il selettore e' localizzato in SS e il suo stack pointer in ESP, mentre i puntatori agli stack a ring piu' bassi sono localizzati nel TSS (Task-State Segment) del task attualmente in esecuzione: quando si accedera' a un livllo di privilegio diverso da ring3, essi saranno utilizzati proprio per creare il nuovo stack, che dovra' essere sufficientemente grande per contenere:
- Il contenuto di SS, ESP, CS ed EIP della procedura chiamante.
- I parametri indicati nella chiamata alla nuova procedura.
- Il registro di EFLAG e gli error code (per le exception e gli interrupt).
Riassumendo, quando viene chiamato un call gate per passare a un livello di privilegio piu' basso (ricordo infatti che *non* e' possibile passare a CPL 3 da CPL 0, 1 o 2 se non attraverso un RET) ecco cosa fa il processore per switchare lo stack:
1- Utilizza il DPL del segmento di destinazione per selezionare un puntatore al nuovo stack dal TSS.
2- Legge il selettore e lo stack pointer per il nuovo stack dal TSS. Eventuali violazioni del limite durante la lettura generano una invalid TSS exception (#TS).
3- Controlla i giusti privilegi del descrittore (sempre dello stack-segment). Se sono erati altra #TS.
4- Salva i valiri di SS ed ESP.
5- Carica selettore e stack poibnter rispettivamente in SS e ESP.
6- Pusha i valori salvati di SS ed ESP nel nuovo stack.
7- Copia dal vecchio stack il numero di parametri specificati nel count field del call gate nel nuovo stack.
8- Pusha il contenuto di CS ed EIP nel nuovo stack.
9- Carica il selettore per il nuovo code segment e il nuovo instruction pointer dal call gate rispettivamente in CS:EIP e inizia l'esecuzione della nuova procedura.

 Calling Procedure's Stack           Called Procedure's Stack

   |                   |                |                 |
   +-------------------+                +-----------------+
   |    Parameter 1    |                |    Calling SS   |
   +-------------------+                +-----------------+
   |    Parameter 2    |                |    Calling ESP  |
   +-------------------+                +-----------------+
   |    Parameter 3    |                |   Parameter 1   |
   +-------------------+                +-----------------+
   |                   |                |   Parameter 2   |
                                        +-----------------+
                                        |   Parameter 3   |
                                        +-----------------+
                                        |    Calling CS   |
                                        +-----------------+
                                        |    Calling EIP  |
                                        +-----------------+
                                        |                 |
Per tornare dalla chiamata piu' privilegiata a quella meno privilegia bastera' utilizzare un semplice RET, naturalmente se non si e' usato un JMP per chiamate la procedura a ring piu' basso.
Senza dover scrivere una a una le operazioni che il processore compie durante un ritorno, basta dire che, dopo aver controllato il campo RPL del CS salvato, carica CS:EIP coi valori salvati nel nuovo stack, controlla se ci sono parametri da salvare e in caso affermativo aggiunge il param count a ESP che quindi ora punta nello stack (della proc a ring basso) a SS ed ESP salvati, tali valori vengono caricati in SS:ESP, e in tal modo si ri-switcha allo stack precedente (avvengono anche soliti check vari), quindi di aggiunge il param count al nuovo ESP e si controllano in contenuti dei data segment register per assicurarsi che la DPL dei segmenti corrispondenti sia maggiore dell a nuova CPL, in caso contraro il registro di segmento e' caricato con un selettore nullo.
Per la pallosissima parte dello stack penso sia tutto:).

Trap Gate & Interrupt Gate
Premetto che questi 2 metodi sono molto simili tra loro, i gate da installare sono identici, spieghero' la differenza alla fine della descrizione.
Prima di iniziare a (s)parlare della IDT, di interrupt e di exception, btw, avviso che cerchero' di essere piu' conciso che in precedenza;) anche perche' questi 2 metodi, oltre ad essere quasi uguali tra loro, sono simili a loro volta ai call-gate.
Un interrupt, come saprete, puo' essere generato dall'hardware del picci' (attraverso l'APIC serial bus) o da un software che gira su di esso (la classica istruzione int n). Un'exception, invece, puo' esser generata da un software (istruzioni INTO, INT 3 e BOUND), ma anche dal processore (che vede un errore durante l'esecuzione di un programma, ad ex durante un privilege level check) e da un machine-check (sia esterni che interni, servono per controllare le operazioni dell'hardware chip interno e le comunicazioni del bus).
Per ogni exception o interrupt il processore definisce un vettore, (che in pratica corrisponde al numero di int o exception, ad ex il vettore del page fault e' il 14) ed le exception sono classificate e suddivise in fault, trap e abort (no non vi preoccupate non sto qui a spiegarne la differenza ;) ).
La IDT (Interrupt Descriptor Table) associa a ogni exception o interrupt un gate descriptor (int gate o trap gate) per la procedura da eseguire (chiamata handler) quando tale int o tale exception si verifica. Come la GDT e la LDT, la IDT e' un'array di descrittori di 8 byte.
Il base address della IDT e' contenuto nei bit 47 --> 16 del registro IDTR, il suo limite nei bit 15 --> 0 dello stesso registro.
Ecco come si presenta un int gate o un trap gate descriptor installato nella IDT.

  31                            16 15 1413 12      8 7   5 4      0 
 +--------------------------------+--+----+---------+-----+--------+
 |                                |  | D  |         |     |        |
 |          Offset 31..16         | P|  P |0 D 1 1 1|0 0 0|Reserved|
 |                                |  |   L|         |     |        |
 +--------------------------------+--+----+---------+-----+--------+

  31                            16 15                             0 
 +--------------------------------+--------------------------------+
 |                                |                                |
 |        Segment Selector        |          Offset 15..0          |
 |                                |                                |
 +--------------------------------+--------------------------------+
Non penso servano troppe spiegazioni sulla struttura di questi gate: il selettore punta al descrittore nella GDT / LDT, l'offset e' la "distanza", in positivo naturalmente, dal base address, ovvero il punto in cui dovra' iniziare l'esecuzione dell'handler.
I bit 4 ---> 0 sono riservati.

Procedure di Exception e Interrupt Handling
Quando il processore effettua una chiamata a un handler di un'exception / interrupt, salva lo stato del registro di EFALG, CS e EIP nello stack. Se il livello di privilegio dell'handler e' lo stesso, si utilizza lo stesso stack, altrimenti avviene uno stack-switching.
Per ritornare dall'int / exc procedure, l'handler utilizza l'istruzione IRET (che rimette a posto i flag in EFLAG)... naturalmente durante tale processo di ritorno se era avvenuto uno stack swithing ora si torna allo stack di partenza.

          IDT                                Dest Code Segment  
 +-------------------+                     +-------------------+
 |                   |                     |                   |
 +-------------------+                     |                   |
 |                   |                     +-------------------+
 +-------------------+                     |                   |
 |                   |                     |Interrupt Procedure|
 +-------------------+Offset +---+         |                   |
 |   Int/Trap Gate   +-----> | + | ------> +-------------------+
 +-------------------+---+   +---+         |                   |
 |                   |   |     ^           |                   |
 +-------------------+   |     |           |                   |
 |                   |   |     |           |                   |
 +-------------------+   |     |           |                   |
 |                   |   |     |           |                   |
 +-------------------+   |     |           |                   |
 |                   |   |     |           |                   |
 +-------------------+   |     +---------> +-------------------+
                         |     |
     Segmente Selector   |     |
 +-----------------------+     |
 |                             |
 |                             |
 |          GDT / LDT          | Base
 |    +-------------------+    | Address
 |    |                   |    |
 |    +-------------------+    |
 |    |                   |    |
 |    +-------------------+    |
 |    |                   |    |
 |    +-------------------+    |
 +--> | Segment Descriptor+----+
      +-------------------+
      |                   |
      +-------------------+
      |                   |
      +-------------------+
      |                   |
      +-------------------+
      |                   |
      +-------------------+
Come detto all'inzio, Trap e Int Gates (sebbene abbiano gate identici) sono leggermente diversi: infatti, quando si accede a un int/exc handler attraverso un int gate il processore pulisce il flag IF per impedire ad altri int di interferire con corrente handler. Fare lo stesso tramite un trap gate non modifica tale flag.
Per quanto riguarda i controlli cui privilege level, essi sono simili a quelli dei call gate: il processore non permette passaggi da livelli piu' privilegiati a livelli meno privilegiati. Il meccaniscmo cmq e' diverso in tali aspetti:
- L'RPL dei vettori non e' controllata visto che i vettori non hanno un'RPL;).
- Il processore controlla la DPL del gate solo se l'exc o l'int e' generato con un INT n, INT 3 o INTO. In tal caso, il CPL deve esser minore o uguale al DPL del gate per evitare che il softwarea ring3 possa accedere a handler a ring0 semplicemente tramite un interrupt.
Apparentemente questa seconda regola potrebbe sembrare un'ignobile bastardata della Intel:) ma in realta' non e' cosi' visto che, poiche' tali restrizioni sono troppo strette ed eventi quali int o exc accadono in modo molto irregolare, per evitare una violazione delle regole si possono usare un paio tecniche, una delle quali dice esplicitamente che un handler puo' cmq essere messo in un nonconforming code segment con livello di privilegio 0, e funzionera' indipendentemente dal CPL a cui stava viaggiando la proc chiamante. Grazie Intel:).
Ed anche per i trap e int gate e' tutto.

Task Gate
Un altro metodo utilizzabile per passare l'esecuzione a una procedura con un privilegio maggiore e' utilizzare un cosiddetto "task gate". Prima di spiegare cos'e' un task gate, pero', tentero' di introdurre al funzionamento dei task in architetture i386. Per definizione, un task e' un'unita' di lavoro che un processore puo' terminare, eseguire e sospendere. Esso puo' essere utilizzato per eseguire un programma, un altro task o processo, un'utility di servizio del SO, un interrupt o exception handler, un'utility del kernel stesso.
Ogni task e' formato da 2 parti: uno spazio di esecuzione e un task-state segment, TSS. Lo spazio di esecuzione consiste in un segmento addetto all'esecuzione di codice, a uno stack segment (o, meglio, a tanti stack segment quanti sonoi livelli di privilegio) e uno o + data segment; il TSS, invece, specifica i segmenti del task e offre uno spazio in cui memorizzare le informazioni del task stesso.
Un task e' identificato da un selettore alla sua TSS. Quando un task e' caricato per l'esecuzione, tale selettore, i limite e un segment descriptor della TSS sono messi nel task register.

        TSS               +---+
 +---------------+ <------| + | <-------------+
 |               |        +---+               |
 |               |          ^                 |
 |               |          |                 |
 |               |          |                 |
 |               |          |                 |
 |               |          |                 |
 +---------------+ <--------+                 |
                            |                 |
                            |                 |
                            |                 |
                            |  Invisible Part |
 +----------------+---------+--------+--------+------+
 |    Selector    |   Base Address   | Segment Limit |
 +-------+--------+------------------+--------+------+
         |                  ^                 |
         |                  |                 |
         |                  +-----------+     |
         |                              |     |
         |                              |     |
         |                              |     |
         |                              |     |
         |                              |     |
         |                GDT           |     |
         |         +---------------+    |     |
         |         |               |    |     |
         |         +---------------+    |     |
         |         |               |    |     |
         |         +---------------|    |     |
         +-------> | TSS Descriptor|----+-----+
                   +---------------+
                   |               |
                   +---------------+
                   |               |
                   +---------------+
Sfruttando proprio il funzionamento dei task e' possibile switchare tra 2 task con differenti livelli di privilegio il 2 modi: e' possibile optare per un trasferimento diretto a un descrittore TSS installato nella GDT che fara' poi riferimento al TSS corrispondente o utilizzare un task gate installato nella GDT, LDT o IDT. Tale task gate puntera' a sua volta a un TSS descriptor nella GDT che portera' ancora una volta al TSS del nuovo task.
Il primo caso verra' trattato sotto; per quanto riguarda il secondo, abbiamo detto che ci vuole un task gate installato nella GDT, LDT o IDT che faccia riferimento a un TSS descriptor nella GDT (questi ultimi si possono mettere solo li'). Ecco di seguito lo schema di un TSS descriptor.
  31           24 23 22 21 20 19    16 15 1413 12 11     8 7              0 
 +---------------+--+--+--+--+--------+--+----+--+--------+----------------+
 |               |  |  |  | A|  Limit |  | D  |  |  Type  |                |
 |   Base 31:24  | G| 0| 0| V|  19:16 | P|  P | 0|        |   Base 23:16   |
 |               |  |  |  | L|        |  |   L|  |1|0|B|1 |                |
 +---------------+--+--+--+--+--------+--+----+--+-+-+-+--+----------------+

  31                                16 15                                 0 
 +------------------------------------+------------------------------------+
 |                                    |                                    |
 |         Base Address 15:00         |         Segment Limit 15:00        |
 |                                    |                                    |
 +------------------------------------+------------------------------------+
I campi base, limit, DPL, i flag G e P hanno funzioni simili a quelle dei data descriptor. Il campo "limit" deve avere una grandezza minima di 0x67 per un TSS a 32bit, un byte meno della grandezza minima di un TSS.
Ecco invece come si presenta un Task-Gate Descriptor.
  31                                 16 15 1413 12 11     8 7              0 
 +-------------------------------------+--+----+--+--------+----------------+
 |                                     |  | D  |  |  Type  |                |
 |               Reserved              | P|  P | 0|        |    Reserved    |
 |                                     |  |   L|  |1|1|0|0 |                |
 +-------------------------------------+--+----+--+-+-+-+--+----------------+

  31                                16 15                                  0 
 +------------------------------------+-------------------------------------+
 |                                    |                                     |
 |        TSS Segment Selector        |               Reserved              |
 |                                    |                                     |
 +------------------------------------+-------------------------------------+
Il DPL e' come sempre il livello di privilegio del descrittore, che deve essere maggiore o uguale al CPL e all'RPL del gate selector.
Caso #3
Il caso #3 consiste semplicemente nel trasferimento diretto al TSS tramite un'istro tipo JMP/CALL che contenta come operando il TSS segment selector desiderato. In questo caso non vengono utilizzati alcun tipo di gate.
In ogni caso, indipendentemente dal metodo utlizzato (uso di gate o trasferimento diretto) prima di effettuare un task switch il processore effettua le seguenti operazioni.
1- Ricava il TSS segment selector (dal task gate o dall'operando dell'istro in caso di switch diretto).
2- Controlla che la CPL del task vecchio e l'RPL del segment selector siano minori o uguali alla DPL del TSS descriptor o del task gate. Le exception e int (a parte gli int n) possono permettere di switchare task senza questi check.
3- Controlla che il TSS descriptor sia segnato come presente e abbia un limite >= 0x67 4- Controlla se il nuovo task e' disponibile o occupato.
5- Controlla che i TSS vecchi e nuovi e i vari descrittori siano mappati in memoria.
6- Se e' utilizzati un JMP o IRET, viene cancellato il falg B, se si e' utilizzata una CALL, exception e int il flag B viene lasciato attivo.
7- Se si e' usato un IRET per lo switch viene cancellato il flag NT in un'immagine temporanea degli EFLAGS che viene salvata; in caso contrario non viene modificato nulla.
8- Salva il corrente (vecchio) task nel suo TSS. ORA AVVIENE LO SWITCH VERO E PROPRIO.
9- Se lo switch e' stato eseguito tramite una CALL, except o int il setta il flag NT in un'immagin nel nuovo TSS. Se e' stato eseguito un IRET, il processore rimette a posto il flag NT. Se e' stato usato un JMP viene lasciato tutto cosi' com'e'.
10- Se il task switch e' stato eseguito tramite un IRET viene mantenuto acceso il flag B del nuovo TSS descriptor; in caso contrario, il flag viene acceso.
11- Setta il flag TS nell'immagine del CR0 nel nuovo TSS.
12- Carica il task register col selettore e descrittore del nuovo TSS.
13- Carica il nuovo stato dello stack dal proprio TSS.
14- Inizia l'esecuzione del nuovo task.

Conclusioni

Questo tute lo dedico a una persona del tutto speciale =).
Un saluto particolare va invece a tutti quelli del racl.
Byz, Ritz for *