Pipeline-Architektur

Die Pipeline Architektur (auch Pipelining genannt) beschreibt die Fähigkeit von Prozessoren, die Abarbeitungssequenz von Maschinenbefehlen zu parallelisieren, mit dem Ziel, dass alle Funktionselemente des Prozessors gut ausgelastet sind. Beim Pipelining  werden komplexe Befehle in Einzelsequenzen zerlegt. Diese können dann parallel ausgeführt werden. Diese Pipeline-Segmente werden taktsynchron von nacheinander geschalteten Verarbeitungseinheiten abgearbeitet.  Beim Hyper-Threading werden z. B. Threads in mehrere Teilaufgaben zerlegt und durch parallel arbeitende Pipeline-Stufen abgearbeitet.  Dazu sind mehrere Registersätze und ein angepasstes Steuerwerk vorhanden. Ein Thread besitzt dazu einen eigenen Registersatz mit Stackpointer und Programcounter.                                                   
Siehe auch:    Multithreading   SMP   Mehrkernprozessor   Simultaneous-Multithreading   Hyper-Threading   Superskalar   

  Superskalar

Ein superskalarer Prozessor verfügt über mehrere Funktionseinheiten pro Befehl. Damit können voneinander unabhängige Befehle parallel bearbeitet werden.  Superskalarität wird durch das Pipeline-Konzept verwirklicht. Unter Pipelining versteht man die Fähigkeit von Prozessoren, Maschinenbefehle bei der Verarbeitung in mehrere Teile zu zerlegen, und im selben Takt zu verarbeiten. Da die Teilaufgaben  parallel bearbeitet werden, kann die Taktfrequenz des Prozessors gesteigert werden. Da ein Befehl jedoch mehrere Takte beim Pipelining benötigen kann, muss die Taktrate, um den Effekt nicht zu vernichten, um denselben Faktor gesteigert werden,  der die Anzahl der Teilaufgaben bestimmt, in die ein Befehl zerlegt wird. Jedoch wird der Datendurchsatz gesteigert, da immer mehrere Teilaufgaben verschiedener Befehle gleichzeitig in Bearbeitung sind,  und bei gleichen Abarbeitungszeiten pro Teilbefehl, jeweils versetzt um eine Teilaufgabenstufe,  diese Teilaufgaben bei Ausführung eines Befehls ausgeführt werden können, so dass - vergleichbar mit einer Fliessbandfertigung - in jedem Takt ein Befehl vollendet wird.  Der Prozessor nimmt eine dynamische Zuteilung von Befehlen vor. Er nutzt die Möglichkeit, die Teilaufgaben parallel zu bearbeiten. Dies geschieht noch vor der Stufe, an der z. B. der Compiler ansetzt.  Durch Superskalarität kann die Anzahl der ausgeführten Befehle pro Takt (Instructions per Cycle, IPC) erhöht werden.                                           
Siehe auch:    Parallele-Datenverarbeitung   Multithreading   Hyper-Threading   Simultaneous-Multithreading   CPU   Dual-Core   Core-2-Duo   Ultra-Large-Scale-Integration   Supercomputer   TeraFLOPS

  Dual-Core

2005 führten AMD und Intel für Desktop PCs Dual-Core-Prozessoren ein. Diese Prozessoren verfügen über 2 Kerne. Damit soll eine beachtliche Leistungssteigerung zu erzielen sein. Dual-Core-Prozessoren können im Gegensatz zum Hyper-Threading eine echte  simultane Verarbeitung zweier Prozesse leisten. Beim Hyper-Threading mit einem Kern (Mehrfädiger-Prozessor, Multithreaded Prozessor)  wird lediglich die Auslastung des Prozessors durch intelligentes Scheduling der Threads und Pipelining optimiert.  Dazu besitzt der Prozssorkern mehrere Registersätze und Programmzähler, und die Threads verfügen über einen eigenen Registersatz mit Stackpointer  und Programcounter. Hyper-Threading ist eine Variante des hardwareseitigen Multithreading. Bei Zweikernprozessoren sind auf dem Prozessor durch die 2 Kerne wichtige  Ressourcen, im Gegensatz zum Einkernprozessor, doppelt vorhanden: ALU, Registersätze oder FPU sowie L1-Caches bzw. L2- und L3-Caches.  In Zukunft wird es Prozessoren mit mehr als 2 Kernen, Multi-Core-Prozessor, und sehr vielen Kernen (16-80 und mehr), Many-Core-Prozessor, geben.  Bei Intel gibt es neben dem normalen Desktop-Prozessor mit Codenamen Smithfield ohne Hyper-Threading auch einen Pentium 4 Extreme Edition (Pentium 4 EE) mit freigeschaltetem Hyper-Threading,  die dann als vier logische Prozessoren gegenüber dem Betriebssystem in Erscheinung treten (weiterhin gibt es den Einkernprozessor Pentium 4 EE, auch mit freigeschaltetem Hyper-Threading).  Damit das überhaupt Sinn ergibt, wird es zwei neue Chipsätze geben, die auch mehr als 4 GByte adressieren können:  den Intel-955X-Express-Chipsatz mit Codename "Glenwood" sowie den 945-Express-Chipsatz, Codename "Lakeport", mit (945G) oder ohne (945P) integrierte Grafik. Auch für den AMD-Opteron gibt es inzwischen die Dual-Core Version für die 2xx- und 8xx-Serien.                                     
Siehe auch:    Core-2-Duo   Intel-Core   Intel   NetBurst   Hyper-Threading   Pipeline-Architektur   Chipsatz   Vanderpool   Mehrkernprozessor   AMD-Opteron

  Intel-Core

Intel Core ist eine Mikroarchitektur von Intel für Mikroprozessoren, die als Nachfolger der NetBurst Architektur gilt. Intel Core wurde für Intels Dual-Core- bzw. Multi-Core-CPUs  entwickelt und zeichnet sich durch eine vergleichsweise kurze Pipeline (14-stufig) und moderate Taktfrequenzen aus. Im Gegenzug verfügt die Intel Core Architektur über eine hohe Anzahl  von Befehlen per Taktzyklus, woraus sich eine entsprechende Leistungssteigerung ergibt. Weitere Merkmale sind: niedrige Verlustleistung, Umsetzung von Vanderpool (Intels Virtualisierungstechnologie),  Hyper-Threading, Extended Memory 64 Technology, 4-fach Superskalarität, 128-Bit Busbreite für die SSE-Befehlssatzerweiterungen (Streaming SIMD (Single Instruction Multiple Data) Extensions),  dynamisches Zuweisen des L2-Cache an die jeweiligen CPU-Kerne, effizienteres Stromsparkonzept, spekulatives Laden von Daten in den Cache (Prefetching) und Verarbeiten (Memory Disambiguation).                                                 
Siehe auch:    Core-2-Duo   Dual-Core   NetBurst   Vanderpool   Virtualisierung   EM64T   Superskalar   SSE   SIMD   Hyper-Threading

  NetBurst

Die NetBurst-Architektur von Intel bezeichnet eine neuartige Architektur des Pentium 4 Prozessors. Merkmale sind: Hyper Pipelined Technology (lange, 20-stufige Pipeline; ermöglicht hohe Taktraten), Rapid Execution Engine: die  Arithmetic Logical Unit (ALU) arbeitet mit doppeltem Kerntakt. Bei einem 3,2 GHz-Prozessor arbeitet die ALU also mit 6,4 GHz. Dies ist möglich, da die ALUs im Chip doppelt vorhanden sind und durch einen Multiplexer, der davorgeschaltet ist,  in einem Taktzyklus 2 Integeroperationen durchführbar sind. Execution Trace Cache:  ist Teil des L1-Caches, speichert dekodierte Mikroinstruktionen so dass die CPU beim Abarbeiten einer neuen Folge von  Prozessen nicht mit Dekodieren aufgehalten wird. Wegen der Wärmeprobleme hat Intel sich entschieden, in Zukunft auf die NetBurst-Architektur zu verzichten.                                                 
Siehe auch:    Pipeline-Architektur   Pipeline   ALU   Pentium-4   Northbridge   Southbridge   Intel   Chipsatz   SSE   Front-Side-Bus

  Very-Long-Instruction-Word

Very Long Instruction Word (VLIW) bezeichnet eine Befehlsformat, dass durch seine Breite mehrere parallele Befehle in einem Prozessor zulässt. Dadurch soll die Leistung des Prozessors verbessert werden.  Die Parallelität der Befehsausführung besteht in der Verarbeitung mehrerer Unterschritte eines sequentiellen Befehls gleichzeitig (Pipelining).                                                       
Siehe auch:    CPU   Intel   Pipeline   SSE