Основните дейности по изпълнението на проекта са обособени в пет работни пакета (РП).
РП1. Подготовка за анализ и съхраняване на големи масиви от секвенционни данни
Ръководител: проф. д-р Владимир Димитров
Участници: Димитър Василев, Огнян Кулев, Деян Пейчев, Анатолий Димитров, Валерия Симеонова
В рамките на този РП ще бъдат извършени следните дейности:
1.1. Проверка на данните за съответствие с изходните формати на технологиите за секвениране
1.2. Предварително почистване на данните
1.3. Синтактичен анализ (парсване) и нормализиране на данните
1.4. Преформатиране на данните в съответствие с методите и алгоритмите за анализ
РП2. Методи и алгоритми за анализ на големи масиви от секвенционни данни
Ръководител: доц. д-р Димитър Василев
Участници: Владимир Димитров, Огнян Кулев, Милко Крачунов, Деян Пейчев, Анатолий Димитров, Ирена Авджиева
В рамките на този РП ще бъдат извършени следните дейности:
2.1. Разработване на нови и усъвършенстване на съществуващи методи за откриване на семантични грешки във входните данни за анализ
2.2. Разработване и усъвършенстване на методи и алгоритми за асемблиране на къси прочити от големи масиви от секвенционни данни
2.3. Разработване и паралелизиране на методи и алгоритми за множествено съпоставяне на асемблирани фрагменти от големи масиви от секвенционни данни
2.4. Валидиране и статистически анализ на резултатите от асемблирането и множественото съпоставяне
РП3. Методи за извличане на закономерности в големи масиви от секвенционни данни
Ръководител: проф. д-р Мария Нишева-Павлова
Участници: Павел Павлов, Милко Крачунов, Огнян Кулев, Валерия Симеонова, Ирена Авджиева, Димитър Василев
Работата по този РП ще включва следните дейности:
3.1. Изследване на методи и алгоритми за извличане на закономерности при откриване на нови структурни варианти от големи масиви от секвенционни данни. Създаване на онтология, интегрираща знания за избраните биологични видове и обекти
3.2. Разработване на метод и алгоритъм за структурно анотиране и разширение на анотирани бази от данни при де ново и слабо секвенирани биологични видове
3.3. Извличане и знания за еволюционното развитие чрез разработване на нови и усъвършенстване на съществуващи методи и аллгоритми за йерархично клъстериране и статистически анализ на анотирани данни от паралелно секвениране
3.4. Разработване на метод и алгоритми за автоматизирано функционално анотиране на гени с използването на различни генни онтологии
РП4. Разпространение на резултатите от проекта
Ръководител: доц. д-р Павел Павлов
Участници: Мария Нишева-Павлова, Димитър Василев, Огнян Кулев, Валерия Симеонова, Ирена Авджиева, Милко Крачунов, Деян Пейчев, Валерия Симеонова
Предвиждат се следните основни дейности в рамките на този РП:
4.1. Разпространение на резултатите в Интернет
4.2. Участие в научни форуми у нас и в чужбина
4.3. Разпространение на резултатите сред научни институции в страната и чужбина
4.4. Организиране на обучителен семинар
4.5. Публикации
Р5. Етични аспекти, поверителност, сигурност и надеждност
Ръководител: доц. д-р Димитър Василев
Участници: Владимир Димитров, Мария Нишева-Павлова, Павел Павлов, Огнян Кулев, Деян Пейчев
Работата по този РП ще включва следните дейности:
5.1. Анализ и избор/разработване на метод(и) за осигуряване на анонимност и поверителност на данните
5.2. Проектиране и разработване на администриран достъп до данните
5.3. Избор на технологични решения за защита и репликация на данните