Основна цел на проекта ще бъде усъвършенстването на съществуващи и разработването на нови методи за анализ на големи масиви секвенционни данни и извличане на закономерности от тях.
Тази цел се декомпозира на следните подцели:
- разработване на иновативни и усъвършенстване на съществуващи подходи и алгоритми за анализ на големи масиви от секвенционни данни, свързани с:
- предварителна обработка на секвенционни данни
- откриване на грешки и технологични неточности в секвенционни данни
- оптимизиране на асемблирането
- оптимизация и паралелизация на подравняването на фрагменти от секвенционни данни
- разработване на подходи за извличане на знания от анализираните масиви от данни:
- откриване на структурни варианти
- автоматизирано анотиране
- предсказване на функции на гени
- еволюционна характеристика на предсказаните гени