За последние 10 лет SQL Server прошел путь от решения для небольших и средних СУБД до мощной платформы данных уровня предприятия, рассчитанной на критичные бизнес-приложения по надежности и отказоустойчивости. С каждым новым релизом SQL Server все больше имеет право называться единым центром управления всеми данными. SQL Server учитывает все современные требования по работе с данными различных форматов и из разнообразных источников и становится естественным выбором для построения платформы интеграции, управления и анализа любых данных.
В последние годы генерируется и обрабатывается все больше данных, увеличивается разнообразие их формы и смысла. Часть данных по-прежнему имеет реляционный формат и генерируется традиционными транзакционными инструментами. Обычно такие данные структурированы, их смысл и ценность хорошо понятны и известны. Но огромное количество данных имеет гораздо более сырой вид. Это данные с датчиков и сенсоров (тот самый Интернет вещей), видеокамер, записывающих устройств. Эти данные, скорее всего, несут ценность, но извлечь ее пока гораздо сложнее.
Роль современной платформы данных – принять такие разнородные данные, интегрировать их, обработать и извлечь ценную для бизнеса информацию. Кроме того, такая платформа должна:
Если за облачную часть обработки данных отвечает Azure SQL, то за локальную составляющую платформы Microsoft для хранения и обработки данных – SQL Server 2019.
*Поддержка Linux и Docker впервые реализована в SQL Server 2017.
Сегодняшние объемы данных делают неразумным и невыгодным конвертацию всех доступных данных в реляционные таблицы для хранения в СУБД. Еще 2 года назад Microsoft представила технологию PolyBase, позволяющую экземпляру SQL Server обрабатывать запросы Transact-SQL, которые обращаются к данным Hadoop и объединять данные из Hadoop и SQL Server. В SQL Server внешняя таблица или внешний источник данных обеспечивает соединение с Hadoop, виртуализируя внешние источники данных без необходимости их прямого импорта в реляционную базу, и потом позволяет обращаться к этим данным с запросами.
Таким образом, данные накапливаются в своем естественном формате, не обязательно реляционном, но могут быть представлены в виде виртуальной таблицы. Виртуализация позволяет интегрировать данные разного формата, из разнородных источников и мест хранения без их репликации и перемещения, создавая единую виртуальную матрицу данных.
Не первый год Microsoft подтверждает высокую производительность SQL Server транзакционными тестам и тестами производительности хранилищ данных. Версия 2019 отмечена отличными результатами в следующих тестах:
Постоянная память (Persistent Memory, PMEM) – это быстрая память, обладающая возможностью хранить данные после отключения питания. Она позволяет обрабатывать данные in-memory, избавляя от необходимости передавать данные по каналам передачи и ускоряя обработку запросов на 30% для интенсивных рабочих нагрузок ввода-вывода.
Любой файл SQL Server, помещенный на устройство PMM, теперь доступен напрямую, минуя стек хранения операционной системы, используя эффективные операции memcpy.
Модель HTAP позволяет одновременно осуществлять операционные транзакции и аналитику на одних и тех же данных в одной и той же памяти, также реализуя подход in memory.
Параллелизация запросов и улучшенное масштабирование частых запросов благодаря механизмам интеллектуальной обработки запросов делают производительность значительно выше. Отложенная компиляция табличных переменных более чем на 50% ускоряет обработку запросов.
Семейство функций интеллектуальной обработки запросов
Приложения и инструменты аналитики работают со всеми реляционными и большими данными через ведущий экземпляр SQL Server при помощи T-SQL
Защита конфиденциальных данных при помощи технологии Always Encrypted с защищенными анклавами. Шифрование на месте позволяет выполнять криптографические операции с конфиденциальными данными без их перемещения за пределы базы данных.
Криптографические операции включают в себя шифрование столбцов, и эти операции теперь можно выполнять с помощью Transact-SQL, они не требуют перемещения данных из базы данных. Внутри защищенных анклавов поддерживаются все полнофункциональные вычисления, включая сопоставления и сравнения диапазонов, что значительно расширяет возможности их применения
Технология Always Encrypted с защищенными анклавами доступна в Windows Server 2019.
Azure Data Studio (бывший SQL Operations Studio) – это упрощенное кроссплатформенное графическое средство управления и редактор кода. Позволяет создавать запросы к реляционным и нереляционным базам данных с поддержкой разных операционных систем и источников данных. Azure Data Studio позволяет подключаться к SQL Server локально и в облаке, в Windows, macOS и Linux.
SQL Server 2019 отличается гибкостью в отношении выбора платформы, языка программирования и средства доставки.
Развитие SQL Server пошлo по пути интеграции с другими аналитическими платформами, в частности Spark, которая включена теперь в поставку SQL Server.
Spark является очень популярным инструментом для машинного обучения, для продвинутой аналитики, имеет эффективную in memory машину. И все это интегрировано с SQL, который очень эффективен для визуализации аналитики.
Правильный анализ и эффективное представление результатов напрямую влияет на эффективность анализа данных и возможность принимать на их основе управленческие решения.