2.2.  Berechnungen des Tunnelstroms

Die Tatsache, daß entgegen der Vorhersage der klassischen Physik überhaupt ein Strom durch eine Potentialbarriere fließt, läßt sich auf verschiedene Weise erklären. Zum Beispiel kann man zeigen, daß die Verweildauer eines Teilchens in einer eindimensionalen rechteckigen Barriere immer kleiner ist als h/(V - E) (siehe Abb.  2.3),


PIC

Abbildung 2.3: Eindimensionale rechteckige Potentialbarriere.

was bedeutet, daß man aufgrund der Heisenbergschen Unschärferelation
DEDt   >  h  ,

welche besagt, daß das Produkt der Energiemeßgenauigkeit DE mit dem Meßfehler der Zeit Dt immer größer als h ist, nicht mit Sicherheit ausschließen kann, daß das Teilchen gleichzeitig eine Energie E < V habe und sich zwischen x = 0 und x = L aufhalte.

Beim Beispiel der rechteckigen Potentialbarriere bleibend läßt sich der Teilchentransfer von links nach rechts auch durch einfaches Lösen der stationären Schrödingergleichung

             2
Ey(x)  = - -h--dy(x)- + V (x)y(x)
           2m    dx

berechnen. Die Transmissionswahrscheinlichkeit lautet für den Fall E < V 0 (siehe z.B. [2] oder [27])

     [                       ]-1
          -----sinh2-kL------
T =   1 + 4(E/V  )(1 - E/V  )    ,
                0          0

wobei k =  V~ 2m(V-----E)-
       0/h ist. Bei Treppenfunktionspotentialen mit endlich vielen Stufen läßt sich die Transfermatrixmethode [23] anwenden.

Notation:
m   Teilchenmasse
V 0 Barrierenhöhe
L Barrierenlänge
E Teilchenenergie

2.2.1.  Tunnelstromdichte nach Simmons bei kleinen Spannungen

1963 hat John G. Simmons die Tunnelstromdichte zwischen zwei metallenen Elektroden für eine beliebige Potentialform in der zwischen ihnen liegenden isolierenden Schicht berechnet [37]. Diese Formel dient als Basis für die in Kapitel  4 durchgeführten Simulationsrechnungen und soll daher im folgenden hergeleitet werden.

Legt man an besagte Elektroden eine Spannung an, so fließt aufgrund des quantenmechanischen Tunneleffekts ein Elektronenstrom.

Notation:
m   Elektronenmasse
e Elektronenladung
V (x) Potential der Barriere
EF Fermienergie
U an den Elektroden anliegende Spannung
J Tunnelstromdichte
f(E) Fermi-Dirac-Funktion
s1,s2 Stellen, an denen V = EF gilt
Ds = s2 - s1, Breite der Barriere
f mittlere Barrierenhöhe
vm maximale Geschwindigkeit der Elektronen
Em maximale Energie der Elektronen
Die Teilchenstromdichte der Elektronen, die in Abbildung  2.4

PIC

Abbildung 2.4: Allgemeine Potentialbarriere innerhalb der Isolatorschicht zwischen zwei Metallelektroden (aus [37]).

von der linken zur rechten Elektrode tunneln, ist gegeben durch
       v                        E
       integral  m                   1  integral  m
N1  =   dvx vxn(vx)T (Ex) =  --   dEx n(vx)T (Ex)  ,
                             m
      0                        0
(2.1)

wobei n(vx)dvx die Anzahl der Elektronen pro Einheitsvolumen ist, deren Geschwindigkeit in x-Richtung zwischen vx und vx + dvx liegt, und T(Ex) die Tunnelwahrscheinlichkeit gemäß der WKB-Näherung (nach Wentzel, Kramers und Brillouin benannt), die u.a. in [24] beschrieben wird:

             (     s2                    )
                 2  integral                    1
T(Ex)  = exp   - --  dx [2m(V  (x) - Ex)]2    .
                 hs
                   1
(2.2)

Die Elektronen im Metall werden als freies Gas angenommen, so daß ihre Zustandsdichte im k-Raum 2V8p3, und im v-Raum 2V8p3-m33-
h (wegen hk = mv) ist. Die Anzahl der Elektronen pro Einheitsvolumen in einem infinitesimalen Geschwindigkeitsintervall ist daher

                  (m  )3
n(v)dvxdvydvz  = 2  --   f(E)dvxdvydvz   .
                    h
(2.3)

Über die Geschwindigkeitskomponenten parallel zur Oberfläche muß also noch integriert werden. Aus Gl.  2.3 erhält man dabei

          m 3 integral  integral + oo              m2    integral  oo 
n(vx) = 2 --     f (E)dvxdvy =  -----3   f(E)dE  || ,
          h                     2p2h
              - oo                      0
(2.4)

mit E|| = 12m(vy2 + v z2).

Nun kann Gleichung  2.4 in Gl.  2.1 eingesetzt werden:

             integral Em           integral  oo 
N1 =  --m---   dEx T (Ex)   dE || f(E)  .
      2p2h3
             0            0

Die Anzahl der Elektronen, die in Abbildung  2.4 von rechts nach links fließen, läßt sich ähnlich bestimmen. Dabei ist zu beachten, daß die Tunnelwahrscheinlichkeit T unabhängig von der Richtung ist, die Fermi-Dirac-Funktion nun aber als Funktion von E + eU genommen werden muß, also

        m    E integral m            integral  oo 
N2  = -----3   dEx  T(Ex)    dE|| f(E + eU )  .
      2p2h
             0            0
(2.5)

Bei U/=0 erhält man eine resultierende Ladungsstromdichte J = eDN mit DN = N1 - N2.

Aus der Abbildung  2.4 geht hervor, daß V (x) = EF + f. Diese Substitution wird in in Gl.  2.2 eingesetzt. Nach Einführung der mittleren Barrierenhöhe         s
f =  -1- integral 2dxf(x)
     Dss1  , zeigt Simmons, daß in guter Näherung

             {   V ~ ---                   }
                2--2mDsb--- V~ -------------
T(Ex)  ~~  exp  -      h       EF  + f - Ex
(2.6)

gilt, was in Anhang  A.1 gezeigt wird, wo auch die Definition des Korrekturfaktors b zu finden ist. Dieser beträgt für kleine Spannungen (U «f /e) ungefähr eins. Wenn man zusätzlich die Fermi-Dirac-Funktion durch eine Stufenfunktion annähert, was aufgrund der hohen Fermitemperatur (T « TF ) der Elektronen in Metallen gerechtfertigt ist, erhält man für J nach einigen einfachen Umformungen (siehe Anhang  A.2) folgenden Ausdruck, in dem Gleichung  2.6 bereits berücksichtigt ist:

             [    EF integral -eU       {      V ~  ------------}
J   =   -em--- eU     dEx  exp  - ADs    EF + f -  Ex
        2p2h3
                   0
          integral EF                  {     V~  -------------}]
    +       dE   (E   - E  )exp  - ADs    E   + f - E     .    (2.7)
               x   F     x                 F         x
       EF- eU
Dabei wurde A =    V~ --
2b-2m-
   h gesetzt. Nach einigen Näherungen bei der Integration von Gl.  2.7, die in Anhang  A.2 detailliert durchgeführt wird, erhält man
          e        {        (     V ~ --)
J =  --2--------2     f exp  - ADs   f
     4p h(bDs)                     (                )}
                   -  (f +  eU) exp  - ADsV ~ f-+--eU-        (2.8)

Gleichung  2.8 bietet einerseits die Möglichkeit, die Tunnelstromdichte ohne die genaue Kenntnis des Barrierenverlauf f(x) zu berechnen —lediglich die mittlere Barrierenhöhe f muß bekannt sein—, andererseits erlaubt sie aber auch, aufgrund einer gemessenen Strom-Spannungs-Charakteristik die mittlere Barrierenhöhe f zu bestimmen.

Der erste Term in Gleichung  2.8 kann als Stromdichte aufgefaßt werden, die von nach rechts tunnelnden Elektronen herrührt, der zweite als diejenige der nach links tunnelnden Elektronen. Die Differenz ergibt die Gesamtstromdichte.

Für kleine Spannungen läßt sich Gl.  2.8 weiter zu

    e2 V~ 2mfU-       (     V~  -)
J = -----------.exp  - ADs   f
       h2Ds
(2.9)

vereinfachen, wie ebenfalls in Anhang  A.2 gezeigt wird. Dabei wird im Ausdruck für A der Faktor b gleich Eins gesetzt, also A = 2 V~ 2m
--h--.

Die exponentielle Abhängigkeit vom Abstand Ds zwischen der Tunnelspitze und der Probenoberfläche ist wesentlich für den Tunnelvorgang: da der Wert von A . V~ f- beim Tunnelmikroskop üblicherweise im Bereich 1 Å-1 –2 Å-1 liegt, variiert der Strom schon über Größenordnungen, bei Abstandsänderungen im Ångstrøm-Bereich. Außerdem weist Gl.  2.9 einen Ohmschen Zusammenhang zwischen Strom und Spannung auf.

2.2.2.  Die Tersoff-Hamann-Theorie

1983, kurz nach der Erfindung des Rastertunnelmikroskops, stellten Tersoff und Hamann eine Theorie zur Berechnung des Tunnelstroms beim STM vor [39]. Sie basiert auf einem dreidimensionalen Modell, in welchem die Tunnelspitze unmittelbar über der Oberfläche als sphärisch angenommen wird. Sie ist die erste quantitative Theorie für das Rastertunnelmikroskop, und es konnte auch sogleich eine Übereinstimmung von Berechnungen für rekonstruierte Gold-(110)-Oberflächen mit experimentellen Ergebnissen festgestellt werden [39].

Die Tersoff-Hamann-Theorie basiert auf der zeitabhängigen Störungstheorie. Mittels Fermi’s Goldener Regel läßt sich der Tunnelstrom nämlich folgendermaßen schreiben:

             sum                              2
I = (2pe/h)     f(Em)[1 - f(En +  eU)]|Mmn |d(Em -  En).
             mn
(2.10)

Notation:
U   angelegte Spannung
f(E) Fermi-Dirac-Funktion
Mmn Tunnelmatrixelement zwischen Spitzenzustand ym
und Oberflächenzustand yn
Em Energie des Zustandes ym
Es können die üblichen Näherungen für kleine Spannungen sowie niedrige Temperaturen gemacht werden,1 so daß die Fermi-Verteilungen aus Gl.  2.10 entfallen können:
        2       sum        2
I = (2pe /h)U     |Mmn | d(En - EF )d(Em - EF ).
               mn
(2.11)

EF ist dabei die Fermienergie. Das Hauptproblem stellt die Berechnung des Matrixelements Mmn dar. Bardeen [1] hat gezeigt, daß

                  integral 
Mmn  = - (h2/2m)    dS (y*m \~/ yn - yn\ ~/ y*m),
(2.12)

wobei die Integrationsfläche komplett zwischen den Elektroden, also innerhalb der Barriere, liegen muß.

Es werden also Ausdrücke für sowohl die Spitzenfunktion ym als auch die Oberflächenfunktion yn benötigt. Die letztere kann zunächst in eine Fourrierreihe entwickelt werden.2 Erstere ist jedoch im allgemeinen unbekannt. Sie wird im Modell von Tersoff und Hamann als Kugelwelle angenommen, mit dem Mittelpunkt r0 (siehe Abbildung  2.5).


PIC

Abbildung 2.5: Schema der Tunnelgeometrie nach Tersoff und Hamann. Die Spitze hat eine willkürliche Form, wird jedoch unmittelbar über der Oberfläche (schraffiert) als kugelförmig mit Krümmungsradius R angenommen. Der Abstand zur Fläche wird hier d, der Mittelpunkt der Kugel r0 genannt. (aus [40])

Jede Winkelabhängigkeit (l/=0) wird vernachlässigt.

Auf diese Weise erhalten sie bis auf einige konstante Faktoren folgenden Ausdruck für den Strom I:

                  2  -4  2kR   sum          2
I  oc  U .DS(EF  ) .R k   .e    .    |yn(r0) |d(En - EF ).
                               n
(2.13)

Dabei ist DS(EF ) die Zustandsdichte an der Fermikante für die Spitze, k =  V~ 2mf--/h die reziproke Abklinglänge der Wellenfunktion im Vakuum, f die lokale Barrierenhöhe und R der effektive Radius der Spitze. Die Summe identifiziert man leicht als lokale Zustandsdichte (LDOS3) der Probenoberfläche an der Fermienergie. Nach dieser Theorie werden bei der Rastertunnelmikroskopie also Abbilder von Flächen konstanter LDOS an der Fermikante erzeugt.

Zwar hat der Wert der Oberflächenwellenfunktion am Ort r0 keine physikalische Relevanz —das Matrixelement ist durch eine Integration vollständig innerhalb der Isolatorregion bestimmt—, doch beschreibt die formale Berechnung von yn im Abstand R + d auf korrekte Weise die laterale Mittelung aufgrund der endlichen Spitzenausdehnung.

Der exponentielle Abfall von yn senkrecht zur Probenoberfläche

yn(r)  oc  e-kz

wirkt sich damit direkt auf den Strom I aus, denn der ist zum Betragsquadrat der Oberflächenzustände am Ort r0 proportional, woraus

I  oc  exp(- 2kd)
(2.14)

folgt. Der Strom gehorcht also auch hier, so wie in der eindimensionalen Betrachtung, der exponentiellen Abhängigkeit vom Abstand und der Wurzel aus der effektiven Barrierenhöhe.

Gute quantitative Übereinstimmung mit STM-Experimenten auf einer 2 × 1-rekonstruierten Gold-(110)-Oberfläche [39] war der erste Erfolg dieser Theorie. Rechnungen für dieses Beispiel ergaben eine laterale Auflösung von 5 Å, womit die Periodizität von 8 Å beobachtet werden kann.

Jedoch wurden bald entscheidende Mängel der Tersoff-Hamann-Theorie erkannt. Sie war vor allen Dingen nicht in der Lage, die atomare Auflösung zu erklären, was unter anderem mit dem Ausschluß der p- und d-Zustände zusammenhängt. So zeigten Ohnishi und Tsukada 1989 mit ihrer Molekülorbitaltheorie [30], daß die dz2-Zustände des Spitzenatoms einer Wolframnadel den dominanten Beitrag zum Tunnelstrom geben. Sie machten dabei verschiedene Modellannahmen für Wolframcluster am Ende der Nadel, mit denen First-Principles-Rechnungen durchgeführt wurden, wobei sich herausstellte, daß die dz2-Zustände eine stark gerichtete und weite Ausdehnung haben und energetisch nahe an der Fermikante liegen.

Ein wichtiges Problem stellt außerdem die gegenseitige Beeinflussung von Probe und Spitze dar. Bardeen ist bei der Berechnung des Tunnelmatrixelements von ungestörten Wellenfunktionen ausgegangen. Dies ist nur bei genügend großen Abständen zwischen den Elektroden gerechtfertigt, d.h. ab einem Abstand von ca. 6 Å, ab dem die atomare Korrugation allerdings verschwindet [13]. Auf Profile großer Überstrukturen wie z.B. eben denen auf Au(110) oder auf einzelne, auf glatten Metalloberflächen adsorbierte Atome, wie es in [25] beschrieben wird, ist die Theorie jedoch gut anwendbar.

2.2.3.  Modifizierte Bardeen-Theorie

Um den Abbildungsmechanismus des STM besser verstehen zu können, insbesondere das hohe laterale Auflösungsvermögen von ca. 2 Å, welches die Unterscheidung einzelner Atome ermöglicht, war es erforderlich, eine neue Theorie zu entwickeln, deren Grundannahmen nicht auf der Bardeennäherung basieren.

1993 stellte Chen in [13] die Modifizierte Bardeen-Theorie (MBA4) vor, in der er die Vorgehensweise von Bardeen abwandelte. Dabei waren folgende Erfordernisse zu erfüllen:

Chen hat gezeigt, daß Bardeens Übergangsmatrixelement selbst bei verschwindender oder sogar negativ werdender Barriere durchaus korrekte Ergebnisse liefert, sofern man die richtig modifizierten Wellenfunktionen einsetzt.

Für die störungstheoretische Behandlung wurde, wie in Abbildung  2.6a


PIC

Abbildung 2.6: (a) Trennfläche zwischen den zwei Untersystemen. (b) Potentialverlauf des Gesamtsystems. (c) und (d) Potentialverläufe der jeweiligen Teilsysteme. (aus [13])

zu sehen, eine Separationsfläche zwischen Nadel und Probenfläche gezeichnet, worauf zwei Untersysteme definiert werden können, deren Potentialflächen jeweils US und UT lauten.5 Sie werden so definiert, daß
US +  UT = U,
(2.15)

das heißt, daß in der Spitzenregion US = 0 und in dem Bereich der Oberfläche UT = 0 gilt. Also gilt die weitere Relation6

USUT  = U.
(2.16)

Abb.  2.6b zeigt den Verlauf von U sowie die Energien der beiden Zustände. In den beiden unteren Diagrammen der Abbildung  2.6 ist zu erkennen, daß die Potentiale US und UT den jeweils zugehörigen ungestörten Potentialen US0 und UT0 gegenüber in der Barrierenregion verringert sind. Die jeweilige Differenz zwischen gestörtem und ungestörtem Potential wird als Störung behandelt. Mit diesen Störpotentialen kann dann zeitabhängige Störungstheorie betrieben werden, mit der man in erster Ordnung (Fermi’s Goldene Regel) die Übergangswahrscheinlichkeit für ein Elektron vom Oberflächenzustand ym in den Spitzenzustand xn

       2p
w(1m)n = ---|Mmn |2d(En -  Em)
        h
(2.17)

erhält.

Das Matrixelement

                  integral 
Mmn  = - (h2/2m)    dS (x*n \~/ ym - ym\ ~/ x*n),
(2.18)

hat hier die gleiche Form wie das der Bardeen-Theorie, doch müssen nun die modifizierten Wellenfunktionen eingesetzt werden. Es hat die Dimension einer Energie. Chen hat gezeigt, daß die Bedeutung dieses Übergangsmatrixelements gerade der Verringerung der Tunnelbarriere durch die Überlappung der beiden Wellenfunktionen, also der Austauschwechselwirkung, entspricht.

Der Effekt des Störpotentials, z.B. V  =_ US -US0, kann mittels der Dyson-Gleichung in erster Ordnung

                integral 
                   3 '     '    '     '
y(r) =  y0(r) +   d rG(r, r )V(r )y0(r )
(2.19)

berechnet werden. Dabei sind y0 und y jeweils die ungestörte beziehungsweise die gestörte Wellenfunktion. Die Greensche Funktion G(r,r') ist durch

(     2              )
  - h-- \~/ 2 + US0 - E   G(r, r') = - d(r - r')
    2m
(2.20)

definiert.

Zur Überprüfung wurde die MBA auf analytisch lösbare Fälle angewandt, nämlich auf das Problem der eindimensionalen rechteckigen Potentialbarriere (siehe Abb.  2.3) sowie auf das Elektron im Wasserstoffmolekülion. In beiden Rechnungen erreicht die Modifizierte Bardeen-Theorie eine hohe Genauigkeit, selbst wenn die Barriere verschwindet oder sogar niedriger als die Teilchenenergie wird. Da die Rechnungen lang und aufwendig sind, werden sie hier nicht aufgeführt; es sei dazu nur auf den ausführlichen Aufsatz von Chen [13] verwiesen.

Für die Anwendung der MBA auf das STM hat Chen explizite Ausdrücke für das Übergangsmatrixelement berechnet, indem er die Wellenfunktionen der Spitze in Kugelflächenfunktionen entwickelte und mit ihnen die Schrödingergleichung löste. Einsetzen einer beliebigen Spitzenfunktion mit einem Bahndrehimpuls bis zu l = 2 sowie der Probenfunktion in Gl.  2.18 lieferte einen Ausdruck für das Matrixelement, der als Linearkombination von partiellen Ableitungen der Probenfunktion am Mittelpunkt des Spitzenatoms geschrieben werden kann.

Dieses Resultat faßte Chen [9] zusammen in der sogenannten Derivative Rule: man schreibe die Spitzenwellenfunktion in Abhängigkeit von x, y und z, nehme folgenden Ersatz vor:

       @                @                @
x- -->  ----,     y - -->  ----,     z --->   ---,
      k@x              k@y              k@z
(2.21)

wende diese Ableitungen auf die Probenwellenfunktion an und erhalte somit das gewünschte Übergangsmatrixelement. k ist wie in Abschnitt  2.2.2 definiert. Zu den detaillierten Rechnungen und Ergebnissen sei wiederum auf [13] verwiesen.

Mittels dieser Regel lassen sich die zu verschiedenen Orbitalen gehörenden Matrixelemente einfach berechnen. Da das Betragsquadrat dieser Elemente proportional zur Tunnelleitfähigkeit ist, erhält man somit die Leitfähigkeitsverteilung s(r).

Bemerkenswert ist dabei, daß man das gleiche Tunnelmatrixelement erhält, wenn man die Probenwellenfunktion mit der Spitzenwellenfunktion vertauscht. So ist s(r) z.B. sowohl im Falle eines s-Orbitals an der Spitze und dz2-Zuständen an der Probenoberfläche als auch im umgekehrten Fall proportional zu (3 cos 2h - 1)2e-2kr. Diese Tatsache wird das Reziprozitätsprinzip genannt [8]. Man kann ein STM-Bild also derart interpretieren, daß das Probenorbital mit dem Spitzenorbital abgetastet wird, oder das Spitzenorbital mit dem Probenorbital. Eine Illustration zu diesem Resultat zeigt Abbildung  2.7.


       SPITZE, dz2    SPITZE, s   
PIC
        PROBE, s    PROBE, dz2   

Abbildung 2.7: Ein intuitives Bild zum STM-Abbildungsmechanismus im Hinblick auf das Reziprozitätsprinzip [8].

Außerdem zeigte der Vergleich der Matrixelemente für Wellenfunktionen verschiedener l-Quantenzahlen (0 < l < 2), daß hohe Werte für l ein Vielfaches der atomaren Korrugation, die die Flächen gleicher lokaler Zustandsdichte (LDOS) aufweisen, ergeben. Damit konnte erstmals eine plausible Erklärung für extrem große mit dem STM gemessene Korrugationsamplituden von bis zu 8 Å auf der Aluminium-(111)-Fläche, die vorerst nicht mit den Resultaten von First-Principles-Rechnungen oder Heliumstreuexperimenten, welche eine Amplitude von nur 0,03 Å für die Fläche gleicher LDOS im Abstand von 3 Å aufzeigen, zu vereinbaren gewesen waren, gegeben werden.

An dieser Stelle seien die wichtigsten Ergebnisse, die sich aus der störungstheoretischen Behandlung des Tunnelproblems von Chen ergeben haben, aufgelistet:

Zum Schluß sollte erwähnt werden, daß es außer der modifizierten Bardeen-Theorie von Chen auch andere Theorien gibt, die von der Bardeen-Näherung abweichende Ansätze haben, wie z.B. den streutheoretischen Ansatz von Doyen in [15] oder die Berechnungen von Noguera in [29] mittels Greenscher Funktionen, die die Kopplung beider Elektroden vollständig mit einbeziehen.