База данных представляет собой наборы данных для однокопийных консервативных маркерных генов: марковская модель для поиска маркерных последовательностей в данных секвенирования, филогенетического древа для классификации прочтений и таксономии терминальных узлов филогенетического древа. Для создания базы данных была проведена фильтрация идентичных последовательностей маркерных генов из исходного набора (более 57 тыс. последовательностей) базы GTDB (База данных полногеномной таксономии), множественное выравнивание отфильтрованных последовательностей, формирование марковской модели, построение филогенетического древа и тестирование полученного набора. GraftM