QuickPath-Interconnect

QuickPath Interconnect (QPI) wurde von Intel entwickelt und löst (ab dem Core i7) den Front Side Bus ab. OPI wurde als Common System Interface (CSI) entwickelt und stellt eine schnelle Bustechnologie zur Verbindung der CPU mit dem Chipsatz dar.  Ein QPI-Link besteht aus zwei 20-Bit breiten seriell unidirektionalen Kanälen, jeweils für das Senden (Transmit) und Empfangen (Recieve) von Daten.  Es werden symmetrische Leiter eingesetzt über welche die differenziellen Signale übertragen werden. QuickPath Interconnect ist als Punkt-zu-Punkt Verbindung organisiert, ebenso wie das Konkurrenzprodukt von AMD HyperTransport.  Diese Punkt-zu-Punkt Verbindungen sind mit On-Die-Terminations (ODT) beidseitig von der Impedanz her abgeschlossen.  Von den 20-Bit eines OPI-Links weden 16 Bit für den Datentransfer verwendet. Der Transfer der Daten findet in 80 Bit Paketen statt. Dabei werden 4 Transferzyklen angesetzt. Von den 80-Bit sind 64 Bit Nutzdaten und 16 Bit für den Header, also praktisch  Overhead (Verwaltungsdaten).  Die Transfergeschwindigkeit liegt bei mehreren Gigatransfer pro Sekunde: bis zu 6,4 Gigatransfer pro Sekunde (GT/s) oder 12,8 GB/s in eine Richtung, bei bidirektionaler Auslegung ergeben sich 25,6 GB/s.                                             
Siehe auch:    HyperTransport   Front-Side-Bus   Northbridge   Southbridge   Chipsatz   Datenbus   Intel   Mehrkernprozessor   Intel-Nehalem-Prozessor   

  Mehrkernprozessor

Als Mehrkernprozessor (Multicore-Prozessor, Multikernprozessor) bezeichnet man Prozessoren mit mehr als einem vollständigen Hauptprozessor. Sämtliche Bauteile,  mit Ausnahme des Busses und einiger Caches sind mehrfach auf dem Prozessor vorhanden. Dadurch wird die Rechenleistung erhöht, die Kosten sind geringer als der Einsatz mehrerer Prozessoren.

Varianten des Mehrkern-Prozessors 
Eine Variante des Mehrkernprozessors ist der Dual-Core-Prozessor (Pentium D: Zweikernprozessor), XEON DP (geeignet für Dual-Prozessor-Systeme, Systeme mit 2 Prozessoren): Dempsey und Woodcrest und der  4-Kern-Prozessor Clovertown (Quad Core) sowie die Intel Core 2 Prozessoren (Core 2 Duo, Core 2 Quad, XEON für die Workstation- und Server-Variante) sowie die XEON MP Systeme  (geeignet für Multiprozessor-Systeme): Tigerton-Dual-Core, Tigerton-Quad-Core. Im Speziellen auf dem Markt sind der Core 2 Duo (Conroe (Desktop: 266 MHz FSB, Quadpumped 1066 MHz (ohne Trusted Execution Technology, TXT):  E6320: 1,86 GHz, E6420: 2,13 GHz, E6600: 2,40 GHz, E6700: 2,66 GHz; 333 MHz FSB, Quadpumped 1333 MHz ohne TXT: E6540: 2,33 GHz,  333 MHz FSB, mit TXT: E6550: 2,33 GHz, E6750: 2,66 GHz, E6850: 3,00 GHz) und Merom (Mobil, Notebook) von Intel, AMD Opteron, Athlon 64 X2 und IBM  PowerPC 970MP.

4-Kern-Prozessoren
Prozessoren mit 4 Kernen sind der Intel Quad Core (Kentsfield und die XEON-Version für Server Clovertown), der AMD 4-Kern Opteron  Barcelona, der Nachfolger des Athlon: der AMD Phenom (AMD Phenom X4 für Sockel AM2+, AMD Phenom FX für Sockel F bzw. F+, AMD Phenom X3 (Sockel AM2+, ein X4 mit einem deaktivierten Kern) und AMD Phenom X2 (Sockel AM2+, Phenom mit  nativem Doppelkern oder X4 mit 2 deaktivierten Kernen). Der Kentsfield entsteht durch 2 Dual-Core Dice des Conroe in einem Chipgehäuse. In der Intel Core-i-Series gibt es mehrere native-4-Kern Prozessoren: Bloomfield und Lynnfield auf der Intel  Nehalem Architektur.

Weitere Intel Mehrkernprozessoren
Von Intel gibt es ausserdem den Conroe-2048 mit einem L2-Cache von 2048 KiB (FSB: 266 MHz, Quadpumped: E6300: 1,86 GHz, E6400: 2,13 GHz)  und den Allendale  (200 MHz FSB: E4300: 1,80 GHz, E4400: 2,00 GHz, E4500: 2,20 GHz, 266 MHz FSB E6300: 1,86 GHz E6400: 2,13 GHz).  Die XEON UP (Uni-Prozessor-Systeme) werden gebildet durch Conroe, Allendale und Kentsfield. 

Technologische Entwicklung, Strukturbreite 45 nm: Intel Penryn und Intel Nehalem, 8-Kern AMD Montreal, Sandtiger 
Es ist derzeit eine Diskussion im Gange, wie viele Kerne ein Prozessor sinnvollerweise haben sollte. Es ist nämlich theoretisch und auch praktisch möglich, sehr viele Kerne auf einem Prozessor unterzubringen, z. B. 80 und auch noch mehr. Der Nachfolger  des Conroe wird der Penryn sein, der auf 45 Nanometer-Technologie gefertigt wird. Um Leckströme zu verhindern wird als High-k-Dielektrikum erstmals das Element Hafnium eingesetzt. Das Gate wird nicht mehr aus Polysilicium sein, sondern aus  einem noch nicht bekanntgegebenen Metall. Der Penryn wird auch stromsparender und leistungsfähiger sein als der Conroe. Der L2-Cache wurde vergrössert und verfügt über 4 bzw. 6 MB. 
Der Nachfolger des Penryn, der Nehalem, wird bis zu 8 Kerne haben und die erste dynamisch skalierbare Mikroarchitektur sein: er ist so konzipiert, dass man spezialisierte Chips, z. B. für Notebooks oder Server-Varianten ohne grossen Aufwand nach  Bedarf kombinieren kann. Die Kerne werden direkte Verbindungen untereinander haben, so dass sie nicht umständlich über ein Bussystem Daten austauschen. Es wird keinen Front Side Bus mehr geben. Stattdessen wird das serielle  Protokoll CSI (Common System Interface), auch bezeichnet als QuickPath Interconnect (QPI), eingeführt. An diese Verbindungen werden auch ein Grafikkern und ein Speichercontroller angebunden ein.  Weiterhin wird jeder Kern in der Lage sein, 2 Threads simultan auszuführen (Intel nennt es Simultaneous Multithreading, eine Variante des Hyper-Threading aus dem Pentium 4 Design).  Auch das Konzept des Multi-Level Shared Cache, bei dem die Prozessor-Kerne einen gemeinsamen Zugriff auf die L1-Caches und auch L2- und L3-Caches haben, soll wieder Einzug halten.

Intel-Core-i-Series: Westmere  AMD arbeitet an den 8-Kern Prozessoren 'Montreal' und 'Sandtiger' die auch in 45 nm Strukturbreite gefertigt werden. Der Sandtiger unterstützt DDR3-Arbeitsspeicher und HyperTransport 3.0. Der DDR3 Arbeitsspeicher wird mit  Hilfe des G3 Memory Extenders, einem neuartigen Speichercontroller, weiter ausbaufähig sein. 
2009 erscheint eine neue Prozessorgeneration auf Basis der Intel-Core-i-Series mit dem Codename 'Westmere'. Es erfolgt die Umstellung des Fertigungsverfahrens auf 32 Nanometer Strukturbreite (Die-Shrink) und eine  Reduzierung auf wieder 2 Kerne.  Dadurch soll die Energieeffizienz erhöht werden. Der erste Vertreter dieser Architektur ist der Clarkdale. Der erste native Hexa-Core-Prozessor (6-Kern-Prozessor) von Intel erscheint: Gulftown.   
Siehe auch:    Intel-Core   Dual-Core   Core-2-Duo   AMD-Opteron   Hyper-Threading   Integrated-Circuit   Front-Side-Bus   High-k-Dielektrikum   HMOS   Die

  Intel-Nehalem-Prozessor

Der Intel Nehalem hat bis zu 8 Kerne und die erste dynamisch skalierbare Mikroarchitektur: er ist so konzipiert, dass man spezialisierte Chips, z. B. für Notebooks oder  Server-Varianten ohne grossen Aufwand nach Bedarf kombinieren kann. Die Kerne haben direkte Verbindungen untereinander, so dass sie nicht umständlich über ein Bussystem Daten austauschen.

Kein FSB, QuickPath Interconnect 
Er verfügt nicht mehr über einen Front-Side-Bus. Um den Prozessorkern mit dem Chipsatz zu verbinden wird eine Punkt-zu-Punkt-Verbindung (QuickPath Interconnect, QPI) eingesetzt. Der Nehalem wird mit einer Strukturbreite von 45 Nanometer gefertigt.  Der Arbeitsspeicher wird über einen integrierten Speichercontroller angebunden. Dadurch verringern sich die Latenzzeiten. Der  Datendurchsatz wird durch das neue Punkt-zu-Punkt-Konzept verbessert, da es keinen FSB als Engpass mehr gibt. Es werden jedoch neue Sockel erforderlich.  Erster Vertreter ist der Bloomfield (Desktop-Prozessor) als Core i7 für Sockel 1366. Der Lynnfield für Sockel 1156 wird der neue Standard in der Mittelklasse sein (Intel Core i5-750, i7-860. i7-870).

3-stufiges Cache-Prinzip, Vermeidung von  Cache Inkoheränzen
Der Nehalem verfügt über ein 3-stufiges Cache Prinzip: L1-Cache und 256 KB L2 Cache für alle Prozessorkerne und einen bis zu 8 MB L3 Cache, den sich alle Kerne teilen.  Um Cache Inkohärenzen zu vermeiden und den Snooping Traffic zu minimieren verfügt der L3-Cache auch über alle Daten des L1- und L2-Cache.  Der Intel Nehalem verfügt über eine Power Control Unit welche eine Art Co-Prozessor für die Energieverwaltung darstellt.  Wie beim Core-2-Duo wurde auch auf Macro-Op-Fusion und Prefetching gesetzt. Alle 4 Prozessorkerne sind auf einem Die untergebracht (nativer 4-Kern Prozessor). SSE 4.2 (Streaming SIMD Extensions) wird mit dem Nehalem Einzug halten.  Der Intel Nehalem beherrscht Simultaneous Multihreading (Intels Hyper-Threading), so dass er mit 4 Kernen gleichzeitig an 8 Threads arbeiten kann.

Prozessorgeneration Westmere 
2009 erscheint eine neue Prozessorgeneration mit dem Codename 'Westmere' aus der Intel Core-i-Series, ein auf 32 Nanometer Strukturbreite (Die Shrink) gefertigter Dual-Core Prozessor auf Nehalem Architektur bzw. einer verbesserten Nehalem Architektur.  Einer der ersten Vertreter wird der Clarkdale sein (Sockel 1156, Chipsätze der x5x-Serie). Die Reduzierung der Kerne soll eine bessere Energieeffizienz bewirken.  Der erste native 6-Kern-Prozessor (Hexa-Core-Prozessor) von Intel wird der auf ebenfalls 32 nm Basis gefertigte Gulftown sein (Sockel 1366).  Die verringerte Strukturbreite (Die-Shrink) soll die Verlustleistung der Prozessoren verringern bei erhöhter Taktzahl.  Der Gulftown (Intel i7-980x) läuft auf Sockel 1366 für X58-Chipsatz-Plattformen. Er verfügt über 1,17 Milliarden Transistoren bei 240 Quadratmillimeter Grösse. Eine weiterer QPI-Link (QuickPath Interconnect) mit 6,4 GT/s ist mit an Bord.  QPI wurde ursprünglich als Common System Interface (CSI) entwickelt und gilt als Nachfolger des Front Side Bus bei Intel Nehalem Prozessoren.  Der Gulftown kann auch mit 2 CPUs betrieben werden. Mit Hilfe des zusätzlichen QPI-Links sind Workstations oder Server mit 12 Kernen möglich; ob diese Funktion auch bei Desktop-CPUs freigeschaltet wird ist noch offen.  Um Strom zu sparen kann sich jeder Kern einzeln selber abschalten (Power Gate), so dass der Gulftown noch in das 130 Watt Schema passt. Der betriebsinterne Inhalt des jeweiligen Kerns kann im L3-Cache zwischen gespeichert werden.                     
Siehe auch:    Intel-Core   Intel   Core-2-Duo   Simultaneous-Multithreading   Hyper-Threading   SSE4   L1-Cache   Strukturbreite   Intel-Sandy-Bridge   Intel-Ivy-Bridge