David Hoksza - Homepage

Procházení chemického prostoru s pomocí dockingu (Nezadáno)

Jazyk: ?

Procházení chemického prostoru je technika umožňující identifikovat v prostoru všech chemických sloučenin cestu, která obsahuje kandidáty na látky mající podobnou aktivitu jako start (S) a cíl (C) této cesty. Motivace problému je taková, že molekuly S a C mají podobnou funkci, tj. vážou se do podbného místa na povrchu proteinu a mají tudíž podobnou strukturu. Molpher pak prochází chemický prostor mezi S a C a hledá posloupnost strukturních modifikací definující cestu z S do C. Mnoho molekul na této cestě ovšem nemusí mít požadovanou funkci, tj. nemusí být schopny vázat se na dané místo v proteinu. Docking je pak technika, která umožňuje odhadnout, jak je pravděpodobné, že molekula se opravdu v daném místě vázat. Start (S) a cíl (C) tvoří vstup algoritmu s názvem Molpher vyvinutý v rámci softwarového projektu na MFF UK. Tento algoritmus je schopen najít cestu v chemickém prostoru, ovšem řídí se pouze sturkturní informací. Cílem práce je tedy nastudovat stávající metody dockingu, vyhodnotit je z hlediska časové složitosti a některou (některé) z nich naimplementovat do algoritmu Molpher a sledovat vliv aplikace dockingu na nalezenou cestu.

Znalosti biologie, nebo chemie stačí na naprosto elementární (ani ne středoškolské) úrovni.

Vyhledávání v databázích protein-protein interakcí (Nezadáno)

Jazyk: ?

V živých organismech takřka neexistuje proces, kterého by se neúčastnily proteiny, přičemž mnoho biologických procesů pak spoléhá na jejich interakci. Takové interakce umožňují existenci komplikovaných jevů v oblastech jako je genetika (přepis genetické informace), imunologie (pronikání virů do buněk) a mnoho dalších. Samotný protein lze chápat jako množinu bodů v 3D prostoru a ukazuje se, že proteiny spolu interagují ve strukturně komplementárních oblastech. Tyto oblasti nazýváme aktivní místa proteinu a lze je buď pozorovat experimentálně, nebo je predikovat pomocí počítačových metod. Máme-li k dispozici databázi proteinových struktur, pak můžeme u každé struktury uchovávat seznam jejích aktivních míst. Cílem práce je pak navržení podobnostní metody pro identifikaci protein interakcí. Dotazem je tedy aktivní místo proteinu (Q) a výsledkem je množina podobných aktivních míst (P) z databáze proteinů. Z předpokladu, že struktura implikuje funkci, pak plyne, že proteiny komunikující s P mohou také komunikovat Q. Předpokládá se, že práce bude vycházet z již navržené podobnostní metody určené pro protein-ligand interakce.

Predikce protein-protein interakcí (Nezadáno)

Jazyk: ?

V živých organismech takřka neexistuje proces, kterého by se neúčastnily proteiny, přičemž mnoho biologických procesů pak spoléhá na jejich interakci. Takové interakce umožňují existenci komplikovaných jevů v oblastech jako je genetika (přepis genetické informace), imunologie (pronikání virů do buněk) a mnoho dalších. Z těchto aplikačních domén pak vypývá nutnost zkoumání principů skrývajících se za interakcí mezi proteiny. Samotný protein lze chápat jako množinu bodů v 3D prostoru a ukazuje se, že proteiny spolu interagují ve strukturně komplementárních oblastech. Tedy problém predikce oblastí interakce mezi proteiny lze redukovat na problém 3D strukturní podobnosti. Vývoj efektivní metody predikující tyto oblasti je náplní této diplomové práce.

Atomix pro Xbox Kinect (Nezadáno)

Jazyk: C#

Cílem hry Atomix, jejíž první verze byla vyvinutá v roce 1990, je složení molekuly z množiny vstupních atomů v 2D hracím poli. V rámci diplomové práce by se měl student seznámit s API pro ovládání herní konzole Xbox a API pro pohybové ovládání Kinect. Následně by měla být vyvinuta aplikace graficky simulující hru Atomix ovšem s možností jejího ovládání pomocí Kinect pro Xbox.

Algoritmus pro identifikaci kavit v proteinech Radoslav Krivák

Jazyk: ?

Prakticky každý proces v živých organismech je zajišťován promocí proteinů. Proteiny vykonávají svoji funkci buď vázáním se na další proteiny (protein-protein interakce), nebo na malé molekuly, tzv. ligandy (protein-ligand interakce). Mezi malé molekuly se také řadí naprostá většina léčiv, jejichž funkce je zajišťována právě pomocí protein-ligand interakcí. Napojením se na aktivní místo proteinu může léčivo např. zabránit vázání jiné látky, která je potenciálně škodlivá pro daný organismus. Aktivní místa pro protein-ligand interakce jsou dutiny, kam se může ligand navázat. Cílem práce ja pak identifikace těchto dutin. Předpokládá se, že práce bude vycházet z již navržené podobnostní metody určené pro protein-ligand interakce.

Procházení chemického prostoru na úrovni scaffoldů Marek Mikeš

Jazyk: C++

Navrhněte a implementujte algoritmus, který bude umožňovat procházení prostoru chemických sloučenin pomocí techniky scaffold hopping, kdy je molekula reprezentována zjednodušenou formou (scaffoldem). Scaffoldy lze definovat s různou úrovní granularity a složitost procházení prostoru je pak dána granularitou scaffoldu. Zadefinujte různé úrovně scaffoldů a na každé z nich implementujte procházení prostoru pomocí morfovacích operátorů (viz. existující algoritmus Molpher). Experimentálně ověřte schopnost nalezení cesty mezi dvojicí molekul v prostoru na různých úrovních granularity.

Vyhledávání v DB chemických struktur Martin Mates (FIT ČVUT)

Jazyk: C++/Java

Vytvořte framework, jehož cílem je usnadnění implementace aplikace pro hledání v databázích chemických sloučenin. Framework bude umožňovat modulárně definovat jak způsob extrakce vlastností z molekul, tak podobnostní míru pracující nad těmito vlastnostmi. Uživatel pak bude moci jednoduše, po dodání metodiky extrakce a definice podobnosti, specifikovat databázi molekul a tuto prohledávat podle podobnosti vzhledem k zadanému dotazu/molekule. Součástí práce bude také implementace několika podobnostních měr a vzorové použití vyvinutého frameworku v příkladové webové aplikaci.

Vícenásobná podobnost RNA struktur Peter Szepe

Jazyk: C++

Práce bude vycházet z metody popsané v článku SETTER - RNA SEcondary sTructure-based TERtiary Structure Similarity Algorithm . Algoritmus SETTER je určen k porovnání 3D struktur RNA, které lze chápat jeko uspořádanou množinu 3D souřadnic, kde každá souřadnice odpovídá jednomu nukleotidu. Mezi nukleotidy navíc existuje párování podobně, jako je tomu u DNA. Princip SETTERu spočívá v rozdělení množiny nukleotidů v porovnávaných strukturách na specifické podmnožiny a dvojicím těchto podmnožin pak přiřazovat podobnosti. SETTER v původní verzi umí porovnávat pouze dvojice RNA, nicméně mnoho reálných aplikací vyžaduje přiřazení podobnosti n-tici RNA struktur. Takovéto rozšíření je náplní bakalářské práce. Projekt vyžaduje pouze velice elemtntární předchozí znalost biologie.

Procházení chemického prostoru na úrovni scaffoldů Petr Říha (FIT ČVUT)

Jazyk: C++/Java

Navrhněte a implementujte algoritmus, který bude umožňovat procházení prostoru chemických sloučenin pomocí techniky scaffold hopping, kdy je molekula reprezentována zjednodušenou formou (scaffoldem). Scaffoldy lze definovat s různou úrovní granularity a složitost procházení prostoru je pak dána granularitou scaffoldu. Zadefinujte různé úrovně scaffoldů a na každé z nich implementujte procházení prostoru pomocí morfovacích operátorů (viz. existující algoritmus Molpher). Experimentálně ověřte schopnost nalezení cesty mezi dvojicí molekul v prostoru na různých úrovních granularity.
Nezvěstný

Použití metrických indexů pro MS (Mass Spectrometry) data (Jiří Novák - ČVUT)

Jazyk: C++

Pro zjištění funkce proteinu je třeba nejprve zjistit jeho sekvenci, tj. posloupnost aminokyselin v něm obsaženou. Za tímto účelem se používá hmotnostní spektrometrie (mass spektrometry - MS). MS provede n rozdělení proteinové sekvence v na různých místech. Tím je získána množina dvojic (levý a pravý úsek dělení), podle jejichž hmostností je třeba určit proteinovou sekvenci ze znalosti vah jednotlivých aminokyselin.

Tento problém lze řešit dvěma způsoby - "De Novo" a vyhledávání v databázích. De Novo přístup je založen obvykle na grafových algoritmech pro odvození řetězce, ale přesnost tohoto přístupu je velice nízká.

Cílem práce je otestovat vhodnost různých typů metrických indexů pro indexování MS dat a pokud možno porovnat se stávajícími metodami vyhledávání v databázích (metoda SEQUEST).
Text práce (PDF)
Obhájeno