Базовые компоненты и архитектура построения СУБД на примере XML СУБД Sedna версий 3.5 и 4.0 (22.09.15)

В ходе доклада будут рассмотрены основные подсистемы в СУБД Sedna и механизмы взаимодействия между этими подсистемами. Также будет рассказана эволюция архитектуры и причины, которые подталкивают изменять методы взаимодействия между подсистемами такого рода проектов.

Докладчик: Олег Борисенко

Видео: https://www.youtube.com/watch?v=D23Vw6iRrZQ

Начало в 19.00

Тестирование решений класса In-Memory Data Grid (17.03.2015)

Этот доклад будет посвящен недавнему проекту с крупным заказчиком. В докладе будет описано, с какими трудностями столкнулась команда, и будет приведен список подводных камней, которые встретились в ходе проекта. Будут затронуты вопросы построения тестовой системы для тестирования, описаны основные возможности тестируемых решений и краткие результаты, полученные в ходе тестирования.

Докладчик: Олег Борисенко

Видео: http://www.youtube.com/watch?v=gnaOvIiaxQI

Предсказание сайтов связывания транскрипционных факторов в геноме (22.04.14)

Доклад повествует о решении одной из задач, решаемой совместно с Институтом общей генетики РАН. Задача состоит в том, чтобы предсказывать наиболее вероятные позиции в геноме, с которыми могут взаимодействовать специальные белки.

В докладе рассматриваются основные определения связанных с задачей биологических терминов и алгоритмические подходы к решению этой задачи.

Докладчик: Олег Борисенко

Презентация (pdf)

Обзор современных прикладных методов сжатия данных (01.04.14)

Данный доклад будет посвящён прикладным утилитам для экономии дискового пространства. Речь пойдет о возможностях сжатия blosc, LZ4, LZO, xz(lzma2), ZFS и о способах их использования. Будет рассмотрено применение распространённых средств сжатия данных в контексте разных классов задач. Доклад не будет затрагивать серьёзных теоретических основ методов сжатия данных.

Докладчик: Олег Борисенко

Презентация (pdf)

Распределенные файловые системы и построение облачных систем (30.04.2013)

Доклад будет посвящён обзору файловых систем, используемых при построении кластеров и систем облачных вычислений.
Одной из первых задач, с которой люди сталкиваются при построении кластеров или распределённых вычислительных систем, является выбор системы хранения данных. Помимо очевидной задачи предоставления общего доступа к ресурсам, каждая вычислительная система предъявляет свои требования к системе хранения. Каждая из файловых систем, рассмотренных в данном докладе, имеет специфические особенности, которые делают её пригодной для решения той или иной вычислительной задачи. В докладе будет предоставлен обзор организации распределённого доступа к данным и последствий, которые влечёт за собой тот или иной метод организации.

Будут рассмотрены следующие протоколы и файловые системы: iSCSI, DBRD, AoE, FCoE, Ceph, GlusterFS, NFS, OCFS, GFS2, Lustre

Докладчик: Олег Борисенко

Презентация с семинара

Использование префиксных деревьев для организации индексов баз данных (13.04.10)

Префиксные деревья (tries) и их разновидности являются одними из самых эффективных структур данных для хренения ассоциативных массивов (обычно со строковыми ключами). Некоторые реализации префиксных деревьев (HAT-trie) сравнимы по производительности с хэш-таблицами.
При этом, в отличие от хэш-таблиц, они позволяют поддерживать отношение порядка между ключами, а также быстро получать все ключи по заданному префиксу.

Предлагается реализация разновидности префиксных деревьев для поддержки индексов баз данных в качестве альтернативы B-деревьям. Наиболее похожим типом деревьев является HAT-trie (cache-conscious trie). В данном типе деревьев учитываются особенности хренения данных в СУБД: изменения локальны относительно страниц; используется максимально компактное представление узлов (с целью занять наименьшее количество страниц). Кроме того, в отличие от B-деревьев, в продложенной структуре данных нет ограничений на длину ключа. Основная задача, которая была решена в ходе работы — это разработка эффективного алгоритма разделения страниц (splitting). Этот алгоритм позволяет обеспечивать оптимальное заполнение страниц.

В настоящее время выполняется сравнение прототипной реализации с существующими реализациями B-деревьев, в том числе, с B-деревьями, во внутренних страницах которых данные представлены в виде префиксного дерева.

Докдадчик: Борисенко Олег.

Материалы:

B-tries for disk-based string management

Презентация с семинара (pdf)

Управление данными и информационные системы

Научный семинар отдела Информационных систем Института системного программирования им. В.П. Иванникова РАН

Posts Tagged ‘Борисенко Олег’

Базовые компоненты и архитектура построения СУБД на примере XML СУБД Sedna версий 3.5 и 4.0 (22.09.15)

Тестирование решений класса In-Memory Data Grid (17.03.2015)

Предсказание сайтов связывания транскрипционных факторов в геноме (22.04.14)

Обзор современных прикладных методов сжатия данных (01.04.14)

Распределенные файловые системы и построение облачных систем (30.04.2013)

Использование префиксных деревьев для организации индексов баз данных (13.04.10)