Последното десетилетие бележи особен интерес и очевиден ръст на научните изследвания (и свързаното с тях финансиране) в областта на анализа на данни от високопроизводителни паралелни секвеницонни технологии. Тези данни се характеризират с изключително големи обеми и относителна неточност. Основен проблем е дисбалансът между използваните в практиката методи и наличните изчислителни ресурси за решаването на проблемите на анализа на големи масиви от секвенционни данни. Във връзка с това усъвършенстването на методите и алгоритмите за различните видове анализ и извличане на съответните закономерности от секвенционни данни е от безусловна важност.
Резултатите от анализа на този вид данни са с изключително значение за био-медицинските геномни изследвания в световен мащаб. В рамките на Европейския съюз (ЕС) се финансират голям брой изследователски проекти, които са насочени към анализа на данни от паралелно геномно секвениране. Почти всеки проект, свързан с изследването на човешкия геном и човешкото здраве, околната среда, земеделието, съхраняването на биоразнообразието генерира големи масиви от данни от паралелно секвениране и има силна потребност от оригинални разработки на методи и алгоритми за анализ на тези данни. В ЕС подобни проекти се разработват успешно в някои от големите центрове във Великобритания, Италия, Франция, Скандинавските страни, Германия, Австрия, като основна роля играе Европейският институт по биоинформатика (European Bioinformatics Institute, http://www.ebi.ac.uk/). От изследователските проекти с най-голямо значение е проектът ELIXIR (European Life Sciences Infrastructure for Biological Information, http://www.bbsrc.ac.uk/science/international/elixir.aspx). В рамките на ELIXIR се разработва платформа за обединяване и анализ на информация и изследователски инфраструктури, която играе важна роля в транслирането на клинични и биомедицински (главно геномни) данни в медицинската диагностика, като основен източник на тези данни е паралелното секвениране. Сред значимите проекти в областта е и iPlant (http://www.iplantcollaborative.org/), който е насочен към осигуряване на достъп до свободни данни, съхраняване и анализ на собствени данни, достъп до високопроизводителни компютърни ресурси, както и споделяне на използваните методи и резултати от анализа. Тези и други проекти са предпоставка в почти всеки нов голям проект, финансиран от ЕС, който е свързан с обработване на данни от паралелно секвениране, да се отделя особено голямо място на методите за анализ и извличане на закономерности от нарастващите с голяма динамика масиви от данни.
Научният колектив, изпълнител на проектното предложение, участва в два проекта, финансирани от ЕС под формата на COST акции, които са посветени имено на методи за анализ и извличане на закономерности от големи масиви от секвенционни данни. Една от целите на тези проекти е създаването на мрежа от лаборатории и изследователски групи в държавите – членки на ЕС и COST за посрещане на всички предизвикателства на анализа на данни и извличането на закономерности от големи масиви от секвенционни данни.