PhD thesis Marcel Swart:
Density Functional Theory Applied to Copper Proteins
  1. Introduction and historical background (pdf)
  2. Methods (pdf)
  3. Force field parameters from quantum chemical calculations (pdf)
  4. Applications of density functional theory (pdf)
  5. Reaction mechanisms (pdf)
  6. Copper proteins: azurin (pdf)
  7. Magnetic interactions in copper proteins and copper complexes (pdf)
  8. UV/VIS spectra of copper complexes (pdf)
  9. QM/MM approach: active site geometries of copper proteins (pdf)
PhD doctoral study
Summary PhD thesis
Chemical research is often associated with laboratories with all kinds of boiling pots and test-tubes, toxic waste by chemical compounds and more of these stereotypes. However, it is not a true image of reality. Even though a large portion of current chemical research is still carried out in the aforementioned experimental manner, a "new" trend within chemical research is the application of clean chemistry, by performing theoretical calculations.

This way of doing research is not exactly new, as the basic principles (of the so-called quantum chemistry) had already been formulated in the beginning of the 20th century. However, for a long time the application of quantum chemistry was limited to relatively small molecules. With the computers getting faster and more powerful, it has been possible in the last couple of years to also take a look at large (bio-)systems. Especially the investigation of metalloproteins by quantum chemical calculations has increased considerably.

The study of metalloproteins is of major importance as they regulate several elementary processes within the human body, as well as in plants and animal life. The application of metal atoms in proteins enable that these processes be carried out under normal "human" circumstances. Copper proteins often function as electron transfer proteins within the complex chemistry in amongst others the human body; that is, at one place an electron is taken up, after which the protein moves to another place and delivers the electron. Using copper for this is "natural" as it is both in the mono-valent (CuI) as the divalent (CuII) form strongly bound to the protein, which is accompanied by a large stability of the protein. Furthermore, often the protein forces the copper atom in a certain conformation, which is midway between the mono- and divalent preferred conformations. This enhances electron transfer and enables the protein to perform its function even more efficiently.

The application of quantum chemistry to metalloproteins shows the same increase as the usage of DFT (Density Functional Theory) within chemical research. Until a few years ago examples of both were relatively scarce, but developments within the field of DFT (as the construction of improved [GGA] potentials, more efficient computer programs with the help of for instance parallel computing techniques) have enabled a situation where it is nowadays almost standard to incorporate (DFT) calculations in (bio)chemical studies.

Still, biosystems like (metallo)proteins remain to be too large to be described completely by quantum chemistry. Moreover, a detailed method would be used for large parts of the system where a less accurate description (by using specially designed force fields) would suffice to describe the relevant processes well. These standard force fields are known to give a good description for capturing dynamical properties, unless there is a metal atom present in the protein, as the interactions of the metal atom with the protein are difficult to generalize in a generally applicable force field. The development of a force field specific for a certain (type of) metalloprotein was one of the aims of the research described in this thesis.

Copper proteins are classified into several types, depending on their structural and spectroscopic properties. Type 2 copper proteins show electron paramagnetic spectra similar to "normal" copper complexes, type 3 proteins show no paramagnetic activity at all, while type 1 copper proteins are characterized by a bright blue color. Therefore, the latter are usually referred to as blue copper proteins. The protein studied in this thesis is azurin, a type 1 copper protein that probably serves as electron transfer protein and that consists of 128 (Pseudomonas aeruginosa) or 129 (Alcaligenes denitrificans) amino acid residues. The copper atom is, just like in all other type 1 copper proteins, in the active site bound to three strong ligands (two histidine and one cysteine amino acid residues) that lie approximately in one plane with the copper atom. There are also two axial amino acid residues (glycine and methionine) that are coordinated towards the copper. In this respect, the glycine residue is special as azurin is the only type 1 copper protein where this residue is coordinated towards copper.

Several methods were developed to obtain the necessary force field parameters for the copper proteins from DFT data. The first method (MDC charge analysis) gives atomic charges that are representative for the studied system; the most relevant molecular and atomic properties (multipoles) for the evaluation of the Coulomb potential are represented exactly. The second method (IntraFF) extracts from the computed Hessian matrix, a matrix with the second derivatives of the energy with respect to the atomic coordinates, values for force constants that can be used in force field calculations or simulations for interactions for which no standard force constant is available.

At first however, a few properties of the usage of DFT were determined, in particular the accuracy of predicted values of molecular polarizabilities, geometries of molecules, and a comparison of the newly developed charge analysis with other methods. The results show that DFT can predict the geometry or polarizability of a molecule or the charge distribution within a molecule very accurately, with an accuracy and efficiency that is difficult to attain with other quantum chemical methods.

DFT was also used to check the proposed mechanism of two reactions. The first reaction that was studied is coming from organic chemistry and involves a zinc atom. The different effects of an aminoalcohol or an aminothiol on the asymmetric addition of dialkylzinc molecules to an aldehyde were investigated; the enantiomeric selectivity as well as the effect on the reaction rate of the catalyst can be explained by the computed results. The second reaction is more in the direction of the aim of the PhD research, as an enzyme was investigated with a copper atom present in the active site. The different stages that lead from the initial complexation of the substrate to the formation of the product were studied, where a few important intermediates were localized.

We then arrive at the studies on copper proteins, where the azurin protein was investigated in its natural (wildtype) form as well as in several other forms where different amino acid residues have been replaced by others. The influence of these replacements (mutations) on relevant properties of the protein has been extensively tested experimentally, which gives a solid framework against which the calculations can be checked. The charge distribution within the active site of azurin (both wildtype as mutated) is shown to have a coherent structure: the way in which the electrons are spread over the site varies little when looking at the different azurin molecules; in all cases the total charge on copper is considerably lower than its formal value, with a large amount of delocalization of charge over the three in-plane ligands, as well as the axial methionine group. This suggests a role as ligand also for the methionine, while the other axial group, glycine, can be better described as coordinating group.

Apart from studying the charge distribution in the active site also force constant values were determined for the bonds between copper and the five amino acid residues in the active site. These values were found to be strongly dependent on the geometry of the site that was used, which is a direct consequence of the anharmonicity of the bond. As the geometry used was taken directly from the experimentally determined crystal structure with a corresponding uncertainty of 0.1-0.2 Angstrom, the harmonic force field parameters should be judged cautiously. It might be better to use the anharmonic parameters, which are also given by the IntraFF method. On the other hand, a molecular dynamics simulation of wildtype azurin using the harmonic IntraFF parameters and the MDC charges results in a stable active site and protein in the simulation, with copper-ligand distances that compare well with experimental values and vibrational frequencies that are in the right range of 200-500 cm-1.

Metalloproteins are often characterized by UV/VIS and EPR/ESR spectroscopy. The spectra of the proteins can therefore be used as reference for comparison with the computed characteristics. In the case of EPR spectroscopy, the so-called g-tensor is dealt with, which is determined by an unpaired electron. Using DFT to compute this tensor seems to be sometimes problematic for systems containing metal atoms, with an underestimation of the z-value of the tensor by up to 50 %. Also the prediction of the hyperfine coupling tensor of copper is sometimes mediocre, with z-values up to three times too large. On the contrary, the hyperfine couplings of the other atoms are reasonably well predicted, especially in the case of copper proteins where the differences between the two histidine residues in the active site are well predicted.

The UV/VIS spectra (or excitation energies) of copper proteins can be computed with DFT only for the reduced state (with copper formally in its +1 redox state), not for the oxidized state (formal redox state +2). Therefore, the UV/VIS spectra were predicted by semi-empirical CNDO/INDO calculations, both for the active site alone as well as the site surrounded by the protein and solvent. The presence of the surroundings was shown to play a decisive role for the computed excitation energies. In this study, the parameters for copper in the reduced state were obtained from fitting the computed semi-empirical excitation energies to the computed DFT energies.

In order to avoid the dependency on the crystal structure with the corresponding uncertainty of 0.1-0.2 Angstrom as well as to investigate the influence of the protein environment on the geometry of the active site, QM/MM calculations were performed. In these calculations the complete protein (including a shell of water molecules around it) was taken into account in the calculation, where the active site was treated with DFT (QM system) and the rest of the protein (and solvent molecules) with a classical force field (MM system), which is designed for the description of biosystems like proteins. A new model (AddRemove) for the direct coupling of the QM and MM systems was developed, in which hydrogen atoms are added in the DFT calculation to satisfy the valences of the QM system. Afterwards the interactions of the added hydrogens with the real QM atoms are corrected for; therefore the artificial introduction of the hydrogens has in principle no effect on the geometry and/or energy.

The geometry of a number of azurin molecules (wildtype, mutated and metal substituted) was optimized by the QM/MM method, where the total number of atoms varied from ca. 2200 to 14.000, depending on the number of water molecules that were taken into consideration in the calculation. The optimized geometry of the active site is in general in good agreement with experimentally observed structures (either crystal or EXAFS). The only real discrepancy is found for the reduced state of the Met121Gln mutant; the computed structure is similar to the reduced wildtype azurin structure, while the crystal structure shows a large deformation. The difference between the computed and experimental structure is that large, and contradictory to the general agreement for the other molecules, that it is not expected that there is something wrong with the calculations. It rather seems that some (unexpected) other effect plays a decisive role here.
Samenvatting proefschrift
Bij scheikundig onderzoek wordt al snel gedacht aan laboratoria met allerlei pruttelende kolfjes en reageerbuisjes, vervuiling door chemische stoffen en dergelijke stereotypes. Een reëel beeld van de werkelijkheid is het echter niet helemaal. Weliswaar wordt een groot deel van het huidige onderzoek nog gedaan op voorgenoemde experimentele wijze, maar een "nieuwe" trend binnen chemisch onderzoek is de toepassing van schone chemie, namelijk met behulp van berekeningen.

Heel erg nieuw is deze manier van onderzoek doen niet, de beginselen (van de zogenaamde kwantumchemie) werden immers al in het begin van de 20ste eeuw geformuleerd. Lange tijd echter was de toepassing van kwantumchemie beperkt tot relatief kleine moleculen, maar door de steeds krachtiger en sneller wordende computers is het in de laatste jaren ook mogelijk om grote (bio-) systemen aan te pakken. Vooral de beschrijving van metaaleiwitten met behulp van berekeningen is de laatste jaren enorm in opmars.

Onderzoek naar metaaleiwitten is van belang aangezien ze verschillende elementaire processen regelen binnen het menselijk lichaam, alsmede in het planten en dierenrijk. Door de toepassing van metaalatomen in eiwitten kunnen deze processen uitgevoerd worden onder "lichaams-eigen" omstandigheden. Kopereiwitten hebben binnen de complexe chemie in onder andere het menselijk lichaam vaak de rol van elektronenoverdrachtseiwitten; dat wil zeggen dat op de ene plek een elektron wordt opgenomen, waarna het eiwit naar een andere plek gaat en daar het elektron weer afgeeft. Het gebruik van koper hiervoor is "natuurlijk" aangezien het zowel in de mono-valente vorm (CuI) als in de di-valente vorm (CuII) een sterke binding heeft met het eiwit, wat gepaard gaat met een grote stabiliteit. Daarnaast is het vaak zo dat het eiwit het koperatoom in een bepaalde conformatie dwingt, die het midden houdt tussen de mono- en di-valente voorkeursconformatie. Dit vergemakkelijkt de elektronenoverdracht waardoor het eiwit zijn functie nog efficiënter kan uitvoeren.

De toepassing van kwantumchemie op metaaleiwitten vertoont dezelfde opmars als het gebruik van DFT (Density Functional Theory) binnen chemisch onderzoek. Tot een aantal jaren geleden waren voorbeelden van beide relatief gezien schaars, maar door de ontwikkelingen op het gebied van DFT (zoals de ontwikkeling van betere [GGA] potentialen, efficiëntere programmatuur onder andere door parallel computing technieken) is het tegenwoordig bijna standaard om DFT berekeningen te gebruiken in onderzoek.

Toch blijven biosystemen als (metaal-)eiwitten te groot om volledig te worden beschreven met kwantumchemie. Daarnaast wordt er een gedetailleerde methode gebruikt voor grote delen van het systeem waar een minder nauwkeurige beschrijving (met behulp van speciaal ontwikkelde force fields) meer dan voldoende is om de relevante processen goed te kunnen beschrijven. Voor de dynamische eigenschappen blijken deze force fields vaak een zeer goede beschrijving te geven, tenzij er een metaalatoom aanwezig is in het eiwit. De interacties van een metaalatoom met het eiwit blijken namelijk moeilijk te generaliseren in een algemeen toepasbaar force field. De ontwikkeling van een force field specifiek voor een bepaald (type) eiwit was een van de doelen van het onderzoek beschreven in dit proefschrift.

Kopereiwitten worden ingedeeld in diverse types, naar gelang hun structurele en spectroscopische eigenschappen. Type 2 kopereiwitten vertonen electronparamagnetische spectra die gelijk zijn aan die van "normale" koper-complexen, type 3 kopereiwitten vertonen helemaal geen paramagnetische activiteit, terwijl type 1 kopereiwitten gekarakteriseerd worden door een felblauwe kleur. Daarom worden ze in de regel blauwe kopereiwitten genoemd. Het eiwit dat werd bestudeerd in dit proefschrift is azurine, een type 1 kopereiwit, dat waarschijnlijk elektronenoverdracht als functie heeft en dat bestaat uit 128 (Pseudomonas aeruginosa) of 129 (Alcaligenes denitrificans) aminozuren. Net als alle andere type 1 kopereiwitten is het koperatoom in het actieve centrum gebonden aan drie sterke liganden (twee histidine en een cysteine aminozuurzijketens) die ongeveer in één vlak liggen met het koperatoom. Daarnaast zijn er twee axiale aminozuurresiduen (glycine en methionine), die gecoördineerd zijn met het koperatoom. Het glycineresidu is speciaal in dit opzicht aangezien azurine het enige type 1 kopereiwit is waar dit residu coördineert met de koper.

Een aantal methodes werd ontwikkeld om de benodigde force field parameters voor deze kopereiwitten te halen uit DFT gegevens. De eerste methode (MDC ladingsanalyse) levert atomaire ladingen op die representatief zijn voor het bestudeerde systeem: de meest relevante moleculaire en atomaire eigenschappen (multipolen) voor de bepaling van de Coulomb potentiaal worden exact gerepresenteerd. De tweede methode (IntraFF) haalt uit de berekende (Hessian) matrix met de tweede afgeleiden van de energie naar de atomaire coördinaten, waardes voor krachtsconstanten die gebruikt kunnen worden in force field berekeningen cq. simulaties voor interacties waarvoor geen standaardwaarde beschikbaar is.

Als eerste werden echter een aantal eigenschappen van het gebruik van DFT vastgesteld, met name de nauwkeurigheid van de voorspelde waardes van moleculaire polariseerbaarheden, geometrie├źn van moleculen, alsmede een vergelijking van de nieuw ontwikkelde ll adingsanalyse met andere methodes. Uit deze resultaten blijkt dat DFT zeer nauwkeurig de geometrie of polariseerbaarheid van of ladingsverdeling binnen een molecuul kan voorspellen, met een nauwkeurigheid en efficiëntie die moeilijk te bereiken is met andere kwantumchemische methodes.

Daarnaast werd DFT gebruikt om het voorgestelde mechanisme van twee reacties te toetsen. De eerste bestudeerde reactie is afkomstig uit de organische chemie, waarbij een zinkatoom betrokken is. De verschillende invloeden van een aminoalcohol of een aminothiol op de asymmetrische additie van dialkylzinkmoleculen aan aldehyde werden onderzocht, waarbij de enantiomere selectiviteit alsmede de versnellende invloed van de katalysator verklaard kunnen worden met behulp van de berekende resultaten. De tweede reactie gaat al meer richting het einddoel van het promotie-onderzoek, aangezien daarin een enzym werd bestudeerd dat een koperatoom bevat in het actieve centrum. De verschillende stadia die leiden van de complexatie van het substraat naar productvorming werden bestudeerd, waarbij een aantal belangrijke intermediairen gelokaliseerd werden.

Hiermee komen we dan bij de studies aan kopereiwitten, waarbij het azurine eiwit bekeken werd in zijn natuurlijke (wildtype) vorm, alsmede in een aantal andere vormen waarbij er verschillende aminozuren vervangen zijn door andere. De invloed van deze vervangingen (mutaties) op relevante eigenschappen van het eiwit is experimenteel uitgebreid getest, wat een uitstekend referentiekader biedt om de berekeningen aan te toetsen. De ladingsverdeling in het actieve centrum van azurine (zowel wildtype als een aantal mutaties ervan) blijkt een coherente structuur te hebben: de manier waarop de elektronen verdeeld zijn binnen het actieve centrum varieert nauwelijks als men kijkt naar de verschillende azurinemoleculen; in alle gevallen is de totale lading op koper een stuk lager dan zijn formele lading, terwijl er een grote mate van delokalisatie is over de drie histidine en cysteine liganden, alsmede over de axiale methionine groep. Dit suggereert een functie als ligand ook voor methionine, terwijl glycine beter omschreven kan worden als coördinerende groep.

Naast het bestuderen van de ladingsverdeling van het actieve centrum werden ook krachtsconstanten bepaald voor de bindingen tussen koper en de vijf aminozuren in het actieve centrum. De waardes hiervoor blijken sterk afhankelijk te zijn van de gebruikte geometrie van het centrum, wat een direct gevolg is van het anharmonische verloop van de binding. Aangezien de geometrie direct overgenomen is van de experimenteel bepaalde kristalstructuur met bijbehorende onnauwkeurigheid van 0.1-0.2 Angstrom, moeten de harmonische force field parameters zorgvuldig bekeken worden. Beter zou het dan zijn om de anharmonische parameters, die ook geleverd worden door de IntraFF methode, te gebruiken. Evenwel, een moleculaire dynamica simulatie aan wildtype azurine met de harmonische IntraFF parameters en de MDC ladingen levert een stabiel actief centrum en eiwit op in de simulatie, met koper-ligand afstanden die overeenkomen met experimentele gegevens en vibratiefrequenties voor de koper-ligandbindingen die in het juiste bereik van 200-500 cm-1 liggen.

Metaaleiwitten worden vaak gekarakteriseerd met behulp van UV/VIS en EPR/ESR spectroscopie. De spectra van de eiwitten kunnen daarom dienen als referentiemateriaal om de berekende karakteristieken mee te vergelijken. In het geval van EPR-spectroscopie gaat het dan om de zogenaamde g-tensor, die bepaald wordt door een ongepaard elektron. Het gebruik van DFT om deze tensor te berekenen blijkt voor systemen met metaalatomen soms problematisch, met een onderschatting van de z-waarde van de tensor tot 50%. Ook de voorspelling van de hyperfijnkoppelingstensor van koper is soms matig, met z-waardes die tot drie keer te groot zijn. Daarentegen worden de hyperfijnkoppelingstensoren van andere atomen vaak redelijk goed beschreven, zeker in het geval van de kopereiwitten waar de verschillen tussen de twee histidine residuen in het actieve centrum goed voorspeld worden.

De UV/VIS spectra (of excitatie-energie├źn) van kopereiwitten kunnen met DFT alleen berekend worden voor de gereduceerde toee stand (met koper formeel in zijn +1 redox toestand), en niet voor de geoxideerde toestand (formele redox toestand +2). Daarom werden de UV/VIS spectra voorspeld met semi-empirische CNDO/INDO berekeningen, zowel voor het actieve centrum alleen als het actieve centrum in de omgeving van het eiwit en oplosmiddel. Hierbij bleek de aanwezigheid van de omgeving een beslissende rol te spelen voor de berekende excitatie-energieën. De parameters voor koper in de gereduceerde toestand werden hierbij verkregen door de berekende semi-empirische excitatie-energieën te fitten aan de berekende DFT energieën.

Om niet afhankelijk te zijn van de kristalstructuur met de bijbehorende onnauwkeurigheid van 0.1-0.2 Angstrom, en om de invloed van de eiwitomgeving op de geometrie van het actieve centrum te bepalen, werden QM/MM berekeningen uitgevoerd. In deze berekeningen werd het hele eiwit (inclusief een schil van watermoleculen rondom) meegenomen in de berekening, waarbij het actieve centrum werd beschouwd met DFT (QM systeem) en de rest van het eiwit (en oplosmiddelmoleculen) met een klassiek force field (MM systeem), dat gespecialiseerd is voor het beschrijven van biosystemen zoals eiwitten. Een nieuw model (AddRemove) voor de directe koppeling van de QM en MM systemen werd daarvoor ontwikkeld, waarin in de DFT berekening waterstofatomen worden toegevoegd aan het actieve centrum om de valentie van het QM systeem te waarborgen. Achteraf worden de interacties van de toegevoegde waterstoffen met de echte QM atomen gecorrigeerd, zodat in principe de artificiele toevoeging van de waterstoffen geen effect heeft op de geometrie en/of energie.

De geometrie van een aantal azurinemoleculen (wildtype, gemuteerd en metaalgesubstitueerd) werd met QM/MM geoptimaliseerd, waarbij het aantal atomen varieerde van ca. 2200 tot 14.000, afhankelijk van het aantal watermoleculen dat meegenomen werd in de berekening. De geoptimaliseerde geometrie van het actieve centrum vertoont over het algemeen een grote gelijkenis met experimenteel bepaalde structuren (ofwel kristalstructuur of EXAFS). De enige echte discrepantie treedt op voor de gereduceerde toestand van de Met121Gln azurine-mutant, die in berekeningen vrijwel identiek is aan de gereduceerde wildtype azurinestructuur, maar die qua kristalstructuur een behoorlijke vervorming vertoont. De afwijking is dermate groot, en voor de rest de overeenkomst tussen berekende en experimentele structuur ook, dat het niet te verwachten is dat er iets mis is met de berekeningen. Het lijkt er eerder op dat er een ander (onverwacht) effect een rol speelt.