Taschenlehrbuch Biologie - Evolution - Oekologie
Außengruppeaus Merkmalswerten mehrerer realer Taxa gebildet wird. Die Erstellung der Merkmalsmatrix mithilfe morphologischer und molekularer Merkmale ist prinzipiell ähnlich. Im Falle molekularer Datensätze stellen die einzelnen homologisierten Sequenzpositionen Merkmalseinträge in der Datenmatrix dar. Die Anzahl der Merkmalszustände ist in den molekularen Daten auf 4 + 1 (4 Nucleotide + Insertion/Deletion) bzw. 20 + 1 (Aminosäuren) festgelegt.
Im zweiten Schritt wird aus der Merkmalsmatrix ein Stammbaum rekonstruiert. Das kladistische Parsimonie-Verfahren soll an einem Beispiel erläutert werden (Tab. 8. 2 ). Die Programme erstellen als erstes (mindestens intern) einen sogenannten ungewurzelten Baum (unrooted tree), auch als Netzwerk oder Topologie bezeichnet. Das ist ein Graph aus Knoten und Kanten. Knoten sind Endpunkte (terminale Knoten) oder Verzweigungspunkte (interne Knoten), Kanten sind die Striche, die die Knoten verbinden. Der ungewurzelte Baum enthält alle eingegebenen Taxa als terminale Knoten. Das Parsimonie-Verfahren optimiert die Anordnung der Taxa so, dass möglichst wenige Merkmalsumwandlungen (Schritte) angenommen werden müssen, um die Verteilung der eingegebenen Merkmalszustände über die Taxa zu erklären.
Tab. 8. 2 Beispielhafte Merkmalsmatrix für eine kladistische Analyse.
Beispiel: Zwei gleich sparsame ungewurzelte Bäume mit der Länge 8 werden gefunden (sie werden beim Taxon A als Außengruppe gewurzelt):
Die ermittelten sogenannten ungewurzelten Bäume werden „ gewurzelt “, indem an einer der Kanten eine zusätzliche Kante – die Wurzel – angesetzt wird. Auf der einen Seite der Wurzel, meist links, wird die Außengruppe bzw. werden die Außengruppen angeordnet. Entweder wurde schon vor diesem Schritt, bei der Eingabe, festgelegt, welche Merkmalszustände plesiomorph sind, oder es wird durch die Wurzelung entschieden. Im ersteren Fall weist die Außengruppealle Merkmale in der plesiomorphen Form auf, im zweiten Fall muss am Kladogramm die Polarität der Merkmale diskutiert werden. Hierbei ist wichtig, dass durch die Wurzelung des Stammbaumes nur die Lesrichtung festgelegt wird, es aber zu keiner Veränderung der Baumlänge kommt.
Vor allem in umfangreicheren Merkmalsmatrizen sind in der Praxis so gut wie immer widersprüchliche Merkmalsverteilungen versteckt. Die Programme minimieren diese Widersprüche und rechnen aus, wie hoch der Anteil von Widersprüchen ist, die ein ausgegebenes Kladogramm noch enthält und die dann als Konvergenzen bzw. Homoplasien erklärt werden müssen. Besonders bei der Verwendung molekularer Merkmale wird dieses einfache Parsimonie-Rekonstruktionsverfahren gegen komplexere sogenannte parametrische Verfahren ersetzt ( Siehe hier ).
Für alle Rekonstruktionsverfahren gilt, dass sie sich sogenannter Heuristiken bedienen müssen, um optimale Ergebnisse erzielen zu können, denn eine vollständige Analyse aller möglichen Bäume ist nur bis etwa 10 Taxa durchführbar. Bedient man sich der „ Branch-and-Bound “ -Methode können exakte Lösungen bis etwa 14 Taxa gefunden werden. Häufig werden aber Verwandtschaftsbeziehungen für >100 Arten gesucht. Heuristische Verfahren sind dadurch gekennzeichnet, dass sie das Finden der besten Lösung nicht garantieren können. Es sind sehr viele verschiedene heuristische Verfahren entwickelt worden, um die Zuverlässigkeit der Stammbaumrekonstruktionen zu erhöhen. Eine Gruppe der Verfahren versucht aus der schrittweisen Manipulation der Startbäume, eine noch bessere Lösung zu finden. Hierbei werden Taxa vertauscht, oder Bäume an einer zufällig gewählten Kante zerschnitten und zufällig alternativ wieder zusammengesetzt. Diese Methoden werden bei Parsimonie- und auch Maximum-Likelihood-Verfahren gleichermaßen angewendet. Ein Computer untersucht hierbei häufig mehrere Millionen von Baumvarianten, bis er zu einem Ergebnis kommt.
Eine alternative Technik sind die sogenannten Markov-Ketten-Verfahren , die eine optimale Lösung durch zufällige Veränderungen in kleinen Schritten suchen. Markov-Ketten-Verfahren werden bei Stammbaumrekonstruktion mit molekularen Daten häufig eingesetzt. Auch hier gilt wieder, dass sehr viele (>1 000 000) Schritte (Veränderungen) notwendig sind, um mit einigermaßen zuverlässigen Ergebnissen rechnen zu können. Alle heuristischen Verfahren suchen im Wesentlichen nach dem Zufallsprinzip nach besseren Bäumen, was diese Verfahren sehr ineffizient macht.
Prinzipiell ist
Weitere Kostenlose Bücher