Новый российский алгоритм в пять раз ускорит анализ геоданных
Принципиально новый подход к пространственной индексации объектов на земной поверхности, который повысит ее производительность в 5-6 раз, предложили ученые МИИГАиК. По их мнению, новый подход найдет применение в системах экологического мониторинга, городского управления, логистики и других пространственных моделях любого масштаба и назначения. Об этом РИА Новости сообщили в пресс-службе вуза. Индексация — это краеугольный камень всех современных баз данных. Именно благодаря ей возможно из миллионов и миллиардов записей найти необходимые практически моментально. Простейшим, знакомым всем индексом является алфавитный указатель в книге, сообщил доцент кафедры информационно-измерительных систем Московского университета геодезии и картографии (МИИГАиК) Олег Гвоздев. «Пространственные индексы, в свою очередь, позволяют быстро искать пространственные объекты, имея координаты в пространстве. Найти ближайшую станцию метро или ресторан. Направить обращение в обслуживающую конкретный адрес диспетчерскую скорой помощи или пожарной. Распределить нагрузку на сотрудников курьерской службы и пункты самовывоза. Сформировать отчет, отражающий распределение событий по районам города и решить другие повседневные задачи», — рассказал Гвоздев. Олег Гвоздев отметил, что обычные методы пространственной индексации позволяют найти объекты, близкие к нужной области, но каждый из них нужно проверить на точное совпадение требованиям запроса. «Наш метод позволяет сразу получить готовый результат, не обращаясь к данным этих объектов. Более того — он позволяет устранить повторные проверки, для случаев, когда, например, несколько объектов имеют общие точки или границы. Это существенно сокращает объем вычислений и дает 5-6-кратный прирост производительности, по сравнению с доминирующими на рынке универсальными решениями (PostgreSQL+PostGIS), и до 30 процентов — по сравнению со специализированными высокопроизводительными методами на базе сеточных индексов», — пояснил он. По мнению авторов, предлагаемый метод будет особенно полезен в системах типа «умный город» или «цифровой двойник», куда данные поступают непрерывным потоком, а количество запросов достигает нескольких десятков тысяч в секунду, и уже в этом десятилетии может достичь уровня миллионов в секунду. Другое потенциальное направление применения разработки — «наука о данных» (Data Science) и анализ больших данных (Big Data Analytics), которые лежат в основе современных ??етодов выработки рациональных управленческих решений в коммерческих организациях и общественных институтах. «Этот результат усиливает и дополняет существующую инструментальную базу, доступную исследователям и разработчикам. С его помощью можно оптимизировать решение множества практически значимых задач. А он, в свою очередь, основан на еще более фундаментальных исследованиях в области теории построения адаптивных информационных и геоинформационных систем. Все это способствует выходу геоинформатики на новый виток интенсивного развития», — рассказал Олег Гвоздев. В заключение ученый напомнил, что любой способ высвободить 5 процентов или даже 2 процента вычислительной мощности позволяет провести больше экспериментов, проанализировать больше данных, а в перспективе — совершить новые открытия. К тому же, предложенный метод принципиально расширяет инструментальную базу специалистов в Data Science. Источник: РИА Новости