Středoškoláci z Havlíčkobrodska pomáhají vědcům zpracovávat obrazová data

Dynamicky rozvíjející se obor zpracování obrazové informace, fascinuje nejen vědce, ale také středoškoláky. Již několik let jim toto téma zasvěceně vysvětluje doktor Jan Schier, který vede stáže Otevřené vědy v Ústavu teorie informace a automatizace AV ČR. Vloni jeho stáž Moderní metody digitálního zpracování obrazu navštěvovala Maria Šimůnková a Jiří Wolker. Výsledky svého ročního bádání středoškoláci z Havlíčkova Brodu shrnuli a představili na studentské vědecké konferenci. Svou práci obhájili úspěšně a získali 1. místo ve vědní oblasti Neživá příroda. O svých zkušenostech ze stáže si s námi popovídali ve společném rozhovoru. 

Stáž doktora Jana Schiera s Mariou Šimůnkovou a Jiřím Wolkerem, byla zaměřena na metody digitálního zpracování obrazu, s praktickou aplikací zejména na mikroskopické snímky biologických preparátů. Na stáži se oba studenti společně zapojili do výzkumu velmi specifické oblasti, a to sledování vývoje dělicího vřeténka (buněčná struktura nezbytná pro tzv. rozchod chromosomů v průběhu buněčného dělení) v samičí pohlavní buňce. Data pro jejich výzkum jim poskytli vědci z Ústavu živočišné fyziologie a genetiky AV ČR.

 

Co přesně jste na stáži zkoumali?

Maria: Na stáži v Ústavu teorie informace a automatizace AV ČR (dále jen ÚTIA AVČR) jsme pod vedením pana doktora Jana Schiera vyvinuli nástroj umožňující automatizované hodnocení dynamiky vývoje dělícího vřeténka, který využívá moderní algoritmus strojového učení konvoluční neuronové sítě. Tento nástroj umožní pracovníkům Ústavu živočišné genetiky a fyziologie AV ČR (dále jen ÚŽFG AVČR) hodnocení funkce konkrétních genů v jednotlivých procesech buněčného dělení. Výsledkem pak vedou k lepšímu pochopení a studiu příčin neplodnosti, Downova syndromu a dalších genetických onemocnění.

Jak se dají výsledky vaší práce na stáži využít v praxi?

Maria: Docent Petr Šolc z ÚŽFG AVČR v Liběchově přišel s tím, že mají problém s časově náročným procesem při zpracování dat. Při zkoumání dynamiky vývoje dělícího vřeténka je třeba provést segmentaci vřeténka ve snímcích ze SPIM mikroskopu. Pro lepší představu, časový 3D záznam vývoje jednoho oocytu představuje data o velikosti asi 6 GB. Dosavadní způsob zpracování dat je nevýhodný: při použití jednoduchých metod musí výsledky projít ještě ruční korekcí, což je časově náročné. Takováto segmentace trvá několik hodin, a přitom nepokryje celý časový záznam.

Jan Schier: Mikroskop našich kolegů biologů totiž v každém okamžiku vytvoří „kostku“, obsahující typicky 50 pravidelně odstupňovaných řezů preparátem (jeden záznam může obsahovat cca 6 GB obrazových dat, resp. zhruba 120 záznamů v čase, s 50 snímky v záznamu – zmíněnými „kostkami“). V rámci jednoho experimentu přitom na pracovišti pořídí 20 i více takovýchto záznamů. To představuje množství snímků, které už nelze zpracovat ručně.

Jiří: Naším cílem je zjednodušit práci zaměstnancům ústavu. Výsledkem našeho projektu je program pro segmentaci snímků, který ústavu dovolí snáze a rychleji zpracovávat informace, které není možné bez pracné úpravy pracovníkem zpracovávat běžnými algoritmy. Navíc díky úspoře času bude možné zpracovat všechna získaná data, doteď to byla pouze šestina snímků.

Proč jste se vlastně rozhodli zkusit (Otevřenou) vědu?

Maria: Již před absolvování stáže jsem se zajímala o umělou inteligenci a její využití v praxi. Právě využití umělé inteligence ve zpracování obrazových dat mě fascinuje nejvíce, navíc mám blízko i k biologii. Díky stáži Otevřené vědy jsem měla možnost pracovat pod vedením odborníka na úrovni přesahující středoškolské studium a dozvědět se mnoho nového v rychle se rozvíjející oblasti, o kterou mám zájem.

Jiří: O projektu Otevřená Věda jsem se dozvěděl na Veletrhu vědy, akci pořádané Akademií věd ČR. Tam mělo svůj stánek i pracoviště ÚTIA AVČR, kde jsem se poprvé setkal se svým budoucím lektorem, dr. Schierem. Vzhledem k tomu, že jsem se už v té době zajímal o programování, výpočetní techniku a mimo jiné i strojové učení, jeho stáž mě ve výběru témat zaujala a přihlásil jsem se na ni.

Co si o svých stážistech myslí lektor Jan Schier?

Jan Schier: V loňském roce se povedlo dát dohromady opravdu hodně dobrý tým. Jirka je výborný programátor a jeden z nejšikovnějších studentů, které jsem vedl. Hodně mě u něj překvapovalo, jakým způsobem dokázal zpracovat i jen rámcově zadaný nápad a jeho implementaci dotáhnout do detailu. Maruška byla zase velmi pečlivá při přípravě dat, hodně se zajímá o matematiku a je skvělá prezentátorka. Studenti prováděli úpravy konvoluční neuronové sítě, která zpracovává data. Jirka je velmi dobrý programátor a odvedl také výborný kus práce na konfiguračním systému, který umožnil hned několik způsobů, jak měnit konfiguraci sítě pro jednotlivé experimenty a provádět je dávkově, a řadu experimentů s jeho pomocí vygeneroval a provedl. Maruška je poměrně zkušená prezentátorka, takže měla hlavní podíl na přípravě abstraktu i prezentace na závěrečné konferenci. 

Jak se vám na stáži ve vašem malém vědeckém týmu spolupracovalo?

Maria: Pan doktor Schier dokázal skvěle odhadnout moje a Jirkovy zkušenosti a podle toho nám rozdělil práci. Já jsem především připravovala trénovací data a poté celé trénování statisticky vyhodnocovala. Měla jsem ale přehled i o úpravách programu. Zároveň jsem musela nastudovat teoretické podklady týkající se struktury používané neuronové sítě. V poslední fázi jsem se intenzivně věnovala přípravě prezentace výsledků naší stáže, měla jsem na starosti přípravu abstraktu a samotné prezentace tak, abychom v 7 minutách co nejlépe přiblížili podstatu naší roční práce a její praktický dopad. Mým posledním úkolem bylo tuto prezentaci na online konferenci přednést.

Jiří: Mě nejvíc baví programování. Vytváření nástroje pro zpracování mikroskopických snímků může být zajímavé. Pro zpracování dat používáme tzv. hlubokou neuronovou síť, což je metoda, která dovoluje vytvořit systém, který se „naučí“ zpracovávat data. To samozřejmě chvíli trvá. Je zajímavé po úpravách programu nebo jeho konfigurace vidět to, jakým způsobem se změnila kvalita výstupu, efektivita zpracovávání nebo rychlost učení.

Co se Vám na stáži nejvíc líbilo?

Maria: Nejvíce se mi na této spolupráci líbí, že přinesla okamžité zlepšení časové náročnosti vyhodnocování dat: nástroj, který jsme vyvinuli, umožňuje automatizované hodnocení dynamiky vývoje dělícího vřeténka v řádu minut. Zároveň jsou vyhodnocena všechna data. Kvůli koronavirovým opatřením probíhala naše stáž většinu roku přes online konferenční prostředí. To naštěstí nebylo pro naši stáž velkou překážkou, protože jsme nebyli závislí na laboratoři či speciálních přístrojích. Na výpočetní servery ÚTIA AVČR je vždy nutné vzdálené připojení. Bohužel jsme se ale kvůli opatřením nemohli navštívit ani spolupracující ústav v Liběchově. Na stáži mě velmi příjemně překvapila lidskost a přívětivost celého vědeckého prostředí. Měla jsem také štěstí na skvělého vedoucího stáže.

Jak vlastně stáže probíhají v době nouzového stavu?

Jiří: Stáž ze začátku probíhala tak, že jsme se i osobně setkávali v Praze, ale s příchodem nouzového stavu jsme veškerou naší komunikaci řešili elektronicky: primárně používáme videokonferenční systém provozovaný na serveru v ÚTIA  AVČR a e-mail. Občas využíváme i běžnou telefonní síť. Pro sdílení zdrojového kódu už od začátku stáže využíváme systém správy verzí, který umožňuje také mít kontrolu nad změnami v programu. Pro spouštění programu používáme výpočetní středisko v ÚTIA AVČR, které je přístupné po internetu. Jeho sdílené úložiště používáme i pro sdílení dat. Kombinace těchto prostředků zajišťuje víceméně plnohodnotnou metodu komunikace.

Jan Schier: Jirka bude ve své práci na stáži pokračovat také letos, ale se dvěma novými studenty. S ohledem na epidemiologickou situaci není jiná možnost než se setkávat online, a jsem rád, že nám to povaha stáže umožňuje. S Jirkou a Maruškou to vloni fungovalo velmi dobře, letos mi s novými studenty trochu chybí ten osobní kontakt, který jsem s loňskými studenty měl alespoň začátkem roku. Na druhou stranu, schůzky jsou takto efektivnější: studenti neztratí celý den cestováním do Prahy, a máme šanci se sejít společně. Při jeiich návštěvách v ÚTIA AV ČR bylo prakticky nemožné sladit schůzku tak, aby proběhla najednou pro více studentů. Další výhodou je, že díky tomu, že studenti nemusí cestovat, mohou být schůzky častěji, třeba jednou nebo i dvakrát týdně. Vloni jsme se před Studentskou vědeckou konferencí setkávali online i denně, abychom věci dotáhli a vyladili. Proto bych i v případě, že vývoj situace dovolí osobní návštěvy studentů v Praze, rád zůstal u kombinace s online schůzkami.

Letos na stáži pokračuje pouze Jiří, Maria maturuje a připravuje se na přijímačky na vysokou školu. Jak bude pokračovat váš výzkum?

Jiří: Ano, i letos pokračujeme ve stejném projektu. Máme v plánu zajistit využití našeho projektu v praxi, tedy zajistit použití vyvíjeného softwaru v ÚŽFG AVČR. Osobní setkání s jejich vědci vloni bohužel kvůli epidemii nevyšlo, ale bylo a je to stále v plánu, tak doufám, že to letos klapne. S novými kolegy stážisty budeme také pracovat na dalším zefektivnění zpracování dat.

Jan Schier: Harmonogram stáže je v hrubých rysech daný tím, že studenti se musí vůbec seznámit s problematikou, s použitím výpočetních prostředků v ÚTIA AVČR a měli by si zkusit sami něco udělat. Potom do toho přijdou prázdniny, kdy má stáž sice probíhat, ale studenti většinou bývají rozutíkání, a tím se její intenzita fakticky hodně sníží, a na podzim už bychom měli dávat dohromady nějaké výsledky a chystat se na jejich prezentaci na studentské konferenci. Takže, tak zhruba do března trvá, než se zaběhnou, a potom máme tři-čtyři měsíce na to, něco udělat. Letos možná s prázdninami "zamíchá" koronavirus a času bude (bohužel) o něco více. Každopádně bych chtěl bych abychom letos zlepšili výkon loňského řešení a pokud možno celé řešení uvést do praktického použití v ÚŽFG AVČR. Doufám, že dobře nastavená spolupráce s kolegy biology bude stejně dobře probíhat i letos. Rád bych, až to podmínky dovolí, pro studenty zařídil exkurzi na toto pracoviště v Liběchově. SPIM mikroskop i s ním spojené datové úložiště jsou opravdu zajímavé. Vloni jsme spolupracovali s Laboratoří integrity DNA. V této laboratoři zkoumají mechanismy dělení jader savčích oocytů. Zhruba před rokem a půl pořídili tzv. SPIM mikroskop (Single-Plain Illumination Microscope), který umožňuje pořizovat časosběrné 3D záznamy preparátu pomocí fluorescenční mikroskopie, získat snímky s nižším šumem a při tom snížit zatížení preparátu fototoxicitou. V letošním roce bude v první řadě třeba dále zlepšit kvalitu segmentace snímků úpravami stávající metody a bylo by dobré vyzkoušet další metody.

 

Otázky pro Mariu Šimůnkovou

Letos už na stáži nepokračujete, hlásíte se na vysokou školu. Kam přesně míříte?

Ano, letos maturuji, takže jsem upřednostnila přípravy na maturitu a přijímací zkoušky na vysokou školu. Hlásím se na FIS VŠE na obor Data Analytics. Můj vysněný obor je ale magisterský obor Biomedical computing na Technické univerzitě v Mnichově. Právě tam bych mohla využít některé znalosti získané během stáže.

Ovlivnilo Vás absolvování stáže při výběru konkrétního studijního oboru?

Již před absolvováním stáže jsem věděla, že chci studovat informatický obor a v budoucnu se zaměřit na umělou inteligenci. Práce s knihovnami na vyhodnocování experimentů a datovou analýzu mi pomohla v mém rozhodnutí jít studovat obor Data Analytics. Také mě stáž utvrdila v mém snu věnovat se zpracování medicínských obrazových dat s použitím umělé inteligence.

Kolik času věnujete samostudiu a tomu, co vás baví mimo školu?

Díky individuálnímu studijnímu plánu a později i distanční výuce jsem měla dost času na samostudium či účast v soutěžích. Ráda si také pouštím podcasty nebo přednášky TEDx. Nejvíce mě v poslední době posunula práce na projektu Nekrachni, kde jsem kromě nových ICT dovedností (UX/UI design, který jsem se naučila pomocí videotutoriálů) získala také zkušenosti s rozjezdem inovativního startupu.

Jak se vám líbilo ve vědeckém prostředí?

Stáž ve vědeckém prostředí byla velmi zajímavou a přínosnou zkušeností. Díky bližšímu vhledu si ještě více cením a považuji za důležitou práci vědců. Osobně se chci ale zaměřit spíše na uplatňování vědeckých poznatků v praxi.

 

Otázky pro lektora Jana Schiera

Jaké znalosti očekáváte od studentů, kteří se hlásí na vaše stáže?

V průběhu stáže pracujeme s anglickými zdroji, odbornými a technickými články. A stáž je v oblasti, označované jako "scientific programming", takže je výhodné, když jsou studenti v programování zběhlí a můžeme se soustředit na specifika našeho problému. Další věc je, že stáží v oblasti IT je velmi málo, a v posledních letech vybírám zhruba z 25 přihlášených, takže je rozumné nastavit ve vstupních požadavcích určitý filtr.

Jak se Vám spolupracuje se středoškoláky?

Zpravidla velmi dobře, na stáži se vlastně potkávám s výběrem motivovaných a šikovných studentů, kteří přinášejí svoje zkušenosti, a je to velmi osobní práce. A neustále se opakující výzvou je přemýšlet nad tím, jak vést stáž, tak aby pro ně byla zajímavá.

Jaké jsou podle Vás předpoklady pro to, stát se úspěšným vědcem?

Já bych to neomezoval na vědce: myslím, že v jakékoliv činnosti, která není jen mechanická, je dobré být zvídavý a organizovaný. Ale je také třeba mít štěstí na učitele a později kolegy, a je velké štěstí mít dobré rodinné zázemí. A to je stejné i pro inženýra, vývojáře, umělce, ale i dobrého řemeslníka a spoustu dalších profesí.

O Janu Schierovi:

Doktor Jan Schier pracuje v Ústavu teorie informace a automatizace AV ČR, Oddělení zpracování obrazové informace. Zajímá se o metody hodnocení biologického obrazu, se zaměřením na mikroskopii. Podílel se na řešení několika projektů Technologické agentury ČR. V minulosti byl několikrát programovým předsedou konference BIOIMAGING, pořádané portugalskou organizací BIOSTEC. Se středoškoláky na stážích Otevřené vědy spolupracuje již několik let. Kromě své vědecké práce se věnuje také popularizaci vědy. Pozn. Letos na stáži dr. Schiera: Moderní metody digitálního zpracování obrazu pokračují kromě Jiřího Wolkera, také středoškoláci Kristýna Petrlíková a Jan Pánek.

O Marii Šimůnkové:

Maria Šimůnková se právě připravuje na maturitu na Gymnáziu v Havlíčkově Brodě, letos proto dala před stáží přednost studiu a přípravám na příjímací řízení na vysokou školu. Maria má za sebou ale už tolik zkušeností jako málokterá středoškolačka. Jen za poslední rok stihla absolvovat stáž Otevřené vědy, vyhrát naši konferenci, umístit se na 10. místě v celostátním žebříčku Středoškolák roku a dostat Cenu hejtmana kraje Vysočina. Informatice, konkrétně umělé inteligenci, se více začala věnovat před více než dvěma lety, v létě 2018, kdy se přihlásila na celoevropský bootcamp zaměřený na digitální dovednosti a umělou inteligenci pořádaný firmou Microsoft. Po návratu hledala uplatnění nově nabytých znalostí v praxi, a proto v rámci práce SOČ navrhla, jak využít chatbota při komunikaci lékaře s pacienty. Ve spolupráci s MUDr. Kuglerovou, pediatričkou z Libčic nad Vltavou, uvedla do praxe textového chatbota v Messengeru Facebooku, který lékařce pomohl zefektivnit komunikaci administrativního charakteru.

O Jiřím Wolkerovi:
Jiří Wolker studuje třetím rokem technické lyceum na stavební škole v Havlíčkově Brodě. Jiří má IQ 148 a je členem Mensy. S nadšením pracuje v Linuxu, velmi dobře programuje v Pythonu, JavaScriptu, ale i v BASHi. Mezi čísly se cítí jako ryba ve vodě, letos proto ve stáži pod vedením dr. Schiera pokračuje, bude dál rozvíjet své znalosti programování a připravovat se na vlastní maturitní projekt. 

Pokud vás téma zpracování obrazové informace zaujalo, přečtěte si o něm víc v našem časopise: A/ Věda a výzkum; 4/2020: Obraz mezi čísly, realitou a iluzí, s. 18–27.

Připravila: Michaela Marková (Otevřená věda) ve spolupráci s Janem Schierem, Mariou Šimůnkovou a Jiřím Wolkerem.