Bioinformatik
Die Bioinformatik-Infrastruktur der Zentralen Forschungslaboratorien ermöglicht computergestützte Analysen großer Datenmengen, wie, z.B. dem gesamten Erbgut eines Lebewesens, um beispielsweise die Entwicklungsgeschichte und die Verwandtschaft von Tieren oder Pflanzen zu erforschen. Ein besonderer Fokus liegt dabei auf der Untersuchung von Gen-Material, welches aus historischen Präparaten des Museums gewonnen und sequenziert wurde.
Kurzbeschreibung
Die Bioinformatik-Einheit des Naturhistorisches Museums Wien umfasst sowohl die technische Infrastruktur für bioinformatische und Biodiversitäts-informatische Arbeiten (Computerserver) als auch konzeptionelle und biostatistische Beratung sowie Training - inklusive Workshops, Online-Tutorials und Forschungskollaborationen. Neben eigenständiger Forschung gehören auch Datenadministration und Datenmanagement, sowie Unterstützung bei diversen bioinformatischen Analysemethoden von DNA-Sequenzen aus rezentem und historischem Material zu unseren Kernaufgaben. Diese Methoden umfassen unter anderem die Rekonstruktion ganzer Genome (de-novo assemblies), Populationsgenomik (Erforschung der Evolution von Populationen einer Art mit Hilfe genomischer Daten), Phylogenomik (Rekonstruktion der Verwandtschaftsverhältnisse unterschiedlicher Taxa mit Hilfe genomischer Daten) sowie Biodiversitätsinformatik (die Erfassung unterschiedlicher Taxa in Ökosystemen mit Hilfe genetischer und genomischer Daten). Ein besonderer Fokus liegt auf „Museomics“ also der bioinformatischen Analyse von fragmentierter und oftmals kontaminierter genomischer DNA aus historischen (Museums-)Proben. Die Bioinformatik-Einheit steht allen Abteilungen des NHM Wien für wissenschaftliche Untersuchungen zur Verfügung, die zum Teil in Kooperation mit nationalen und internationalen Forschungspartnern durchgeführt werden.Methoden & Expertise zur Forschungsinfrastruktur
Ein Schwerpunkt liegt auf der Methodenentwicklung in den Bereichen Biodiversitätsinformatik, Populationsgenetik und -genomik und „Museomics“ mit Hilfe der Programmiersprachen Python, R und BASH Scripting. Des Weiteren entwickeln wir Analysepipelines basierend auf bereits bestehender Software. Wir bieten umfassende Schulungen im Bereich Datenmanagement und entwickeln Themen-spezifischer Tutorials und Workshops für Student*innen und Mitarbeitende. Wir beraten auch bei bioinformatischen Vorhaben im Rahmen von Projektplanungen und forcieren den Einsatz von GitHub für open-source-Entwicklung und zum kollaborativen bioinformatischen Arbeiten. Eine weitere wichtige Aufgabe ist die Maintenance unseres Computerservers sowie die Koordination des kollaborativen Arbeitens mit Hilfe der job-scheduling Software OpenPBS.Geräteausstattung:
- Server Type: Dell PowerEdge R7525
- CPU: 2 x AMD 7742 (2.25GHz; 64cores/128threads; 256MB cache; 225W)
- RAM: 2 TB
- Storage: 3.84 TB (RAID0; 2x 3.84 TB SSD vSAS); 48 TB (RAID5; 4 x 16 TB SAS HD)
- OS: AlmaLinux OS 8