Kann man die Shadereinheiten von Fermi und Kepler vergleichen?

DungeonKeeper1

Komplett-PC-Aufrüster(in)
Bzw. Wie ist es möglich, dass Kepler die dreifache Menge an Shadereinheiten als Fermi hat. Reicht der kleinere Fertigungsprozess aus? Und wie ist es möglich dass diese Chips so energieeffizient sein können? Ich danke schon einmal herzlichst im Voraus. Stefan Plöchinger
 
Eine genaue Erklärung würde den Rahmen der Forensprechstunde sprengen. Ein erster Lektüre-Tipp wäre die PCGH 05/2012, speziell Seite 46/47.

Ein paar Stichworte sind unter anderem, dass der 28nm-Prozess etwa die doppelte Transistor-Dichte pro Quadratmillimeter erlaubt, dass Teile des Hardware-Schedulers, speziell das Dependency-Checking von Instruktionen mit bekannter Laufzeit von der Hardware in den Treiber verlagert wurden, der Verzicht auf Half-Rate-DP-Berechnungen und andere GPU-Compute-Features, wie sie noch der GF100 bot und generell der Verzicht von Steuerlogik zugunsten weiterer Recheneinheiten. Vom Prinzip her ist letzteres ein ähnlicher Ansatz wie der, den AMD verfolgt - darum ist die GTX 680 auch nicht doppelt so schnell wie die GTX 580.
 
Ähnliche Frage: Wie ähnlich sind sich AMDs und Nvidias Shader denn mittlerweile, sprich in den aktuellen 28nm-Generationen?
 
Besten Dank, Carsten. :) Das hat mich schon enorm weitergebracht. Werde mir das von Dir genannte Heft (Abo-User) nochmal intensiv zur Gemüte ziehen und mir den Technikpart durchlesen. Ich glaube, ich habe ihn übersehen. Aber dennoch Danke für Deine Erklärung! :) Stefan
Eine genaue Erklärung würde den Rahmen der Forensprechstunde sprengen. Ein erster Lektüre-Tipp wäre die PCGH 05/2012, speziell Seite 46/47.

Ein paar Stichworte sind unter anderem, dass der 28nm-Prozess etwa die doppelte Transistor-Dichte pro Quadratmillimeter erlaubt, dass Teile des Hardware-Schedulers, speziell das Dependency-Checking von Instruktionen mit bekannter Laufzeit von der Hardware in den Treiber verlagert wurden, der Verzicht auf Half-Rate-DP-Berechnungen und andere GPU-Compute-Features, wie sie noch der GF100 bot und generell der Verzicht von Steuerlogik zugunsten weiterer Recheneinheiten. Vom Prinzip her ist letzteres ein ähnlicher Ansatz wie der, den AMD verfolgt - darum ist die GTX 680 auch nicht doppelt so schnell wie die GTX 580.
 
Bzw. Wie ist es möglich, dass Kepler die dreifache Menge an Shadereinheiten als Fermi hat. Reicht der kleinere Fertigungsprozess aus? Und wie ist es möglich dass diese Chips so energieeffizient sein können? Ich danke schon einmal herzlichst im Voraus. Stefan Plöchinger
Ich stimme Carsten nicht ganz zu. Eine doppelte Integrationsdichte ist zum Teil zu hoch gegriffen. Zusätzlich zu Carsten seinen Ausführungen ist zu nennen, dass bei Kepler kein Hotclock mehr vorhanden ist. ( Shader laufen mit doppelt so hohem Takt, wie der Chiptakt). Intern kann es bedeuten, dass die Pipeline kürzer ist, dass man weniger leakage hat, weniger Transistoren für die Isolation benötigt und insgesamt weniger Luft zwischen den Einheiten braucht und somit insgesamt die Packdichte stark ansteigt.
Kepler hat auch 8 SMX-Cluster mit je 192- Stream-Prozessoren und nicht wie damals noch 8 SM-Cluster mit je 48-SPs (GF104) oder wie beim GF110 16 SM-Cluster mit jeweils 32 SPs. Dadurch spart man Platz. Bei Kepler laufen die ALUs auch 35% langsamer, als noch beim Fermi, dafür ist der Chiptakt aber auch deutlich höher getaktet.

Ähnliche Frage: Wie ähnlich sind sich AMDs und Nvidias Shader denn mittlerweile, sprich in den aktuellen 28nm-Generationen?
Ich denke das kann niemand eindeutig sagen. Die Arbeitsweise ist immer noch anders und der Aufbau ebenso und ohne die genauen Internas, die weder AMD noch Nvidia herausgeben werden, kann man das nur an einigen Punkten vergleichen.
Speziell fällt mir ein, dass auch bei AMD und Nvidia viele Operationen noch andere Wartezyklen haben, die Cache-Verteilung pro Cluster anders ist, AMD Vec16-ALUs verbaut, Nvidia mit Kepler auf Vec32-ALUs umgerüstet hat, das Sheduling anders gelöst wird usw.
 
Zurück