Power BI по понятиям. Часть первая. Данные.

5829

Знание основ и их однозначная трактовка облегчает понимание нового материала и позволяет нам разговаривать на одном языке. Нам важны оба аспекта, поэтому, учитывая многочисленные вопросы пользователей, которые начали к нам поступать при освоении Power BI в начале работы, мы сделали шаг назад (чтобы потом прыгнуть на два вперёд) и подготовили маленькую, но весьма полезную серию статей по основным понятиям программы. Наборы данных и их обновления, отчёты и панели мониторинга, плитки и визуализации, из чего состоят все эти блоки, какие из них входят в другие, можно ли (и как) создать отчёт, основанный на нескольких наборах данных одновременно – всё это и многое другое мы раскладываем по полочкам. Дальше будет легче. В первой части мы расскажем вам всё о данных, во второй – всё о стандартных блоках Power BI. Итак, данные и как их готовить.

Источники и наборы данных

Мы уже писали про данные (например, про новые расширенные возможности загрузки), но, видимо, не достаточно ёмко и не всегда просто, раз у вас возникают вопросы. Этот раздел расставит все точки над i.

Следует изначально разделить связанные, но абсолютно разные понятия, которые иногда смешивают (забегая чуть вперёд – да, частично они пересекаются): «источник данных» и «набор данных«.

Источник данных – это только конечный путь к информации, с которой вы хотите работать. Путь к файлу на жёстком диске, URL-ссылка на фейсбук или место хранение базы данных в облаке – всё это путь и всё это – источник данных.

А набор данных – это, в свою очередь, совокупность и источника данных, и самих данных (в ряде случаев, при необходимости, ПО копирует данные, а не просто на них ссылается), и учётных записей, которые позволяют подключится Power BI к этим источникам данных. Т.е. каждый раз, когда вы подключаетесь к данным (статическим или динамическим) или импортируете их, Power BI автоматически создаёт набор данных. Которые затем, как правило, используются при создании отчётов и визуализаций.

Подключение к некоторым источникам данных иногда требует расширенных функций запросов и моделирования Excel или установленного приложения Power BI Desktop. В конце этот статьи мы кратко перечислим те возможности, которые предоставляет Power BI Desktop в разрезе подключения к данным.

Перед тем, как перейти непосредственно к разбору типов данных, которые можно загружать в Power BI, хочется обратить Ваше внимание на то общее, что есть у этих типов или, если точнее, – какими характеристиками должны обладать ваши источники для того, чтобы с ними можно было работать в Power BI. И вот основное, что нужно об этом знать:

Формат данных

8_1

Формат данных, естественно, должен поддерживаться Power BI. Обычно с этим проблем не возникает, однако, некоторые типы данных уже готовы к работе с Power BI, а какие-то придётся «подготовить». Так, например, при создании наборов данных из таких источников как Google Analytics или Twilio – никаких сложностей с синхронизацией не возникает. Аналогично и просто загружаются данные и из облачных баз данных типа  SQL Azure. Они полностью готовы к работе. Наслаждайтесь.

Но в отдельных случаях прямое импортирование данных невозможно. В частности, – при попытке подключиться к данным, которые расположены на серверах Вашей компании (данные с закрытым доступом) или при попытках загрузить простой TXT-файл. В такой ситуации необходимо:

  1. Извлечь эти данные;
  2. Воспользоваться всеми любимым Excel или Power BI Desktop для первоначальной загрузки данных;
  3. Сохранить полученные данные в виде файла;
  4. Импортировать файл в Power BI.
  5. Profit!

Обновления данных

8_2Хотите всегда иметь актуальную информацию? Наверняка хотите и Power BI может предоставить Вам такую возможность. Используя сведения о подключении (которые, как мы уже говорили, входят в набор данных наряду с указанием источника данных), Power BI подключается к нужным данным, проверяет их на наличие изменений, обновляет свой набор данных а, заодно, и всё связанное с этим набором (отчёты, визуализации и т.д.).

В ближайшем будущем мы обязательно подробно рассмотрим тему обновления данных отдельно, потому как об этом можно и нужно рассказывать много и долго, а в рамках этой статьи мы коснёмся  только самого важного: как часто обновляются данные и что для этого нужно сделать?

Частота обновления зависит от типа обновляемых данных, но, например, для некоторых облачных хранилищ данных (таких, как файлы службы OneDrive) Power BI проверяет источник примерно раз в час. Однако стоит помнить, что сами пакеты того же OneDrive обновляются примерно раз в сутки. И, конечно, вы можете настроить время обновлений по своему желанию (если оно поддерживается набором данных) или обновить отчёт по только что изменённому файлу в любой момент времени вручную.

Ответ на вопрос «что нужно для обновлений» также зависит от типа данных. Иногда для этого ничего не требуется, а иногда вам придётся воспользоваться персональным шлюзом Power BI Gateway. Это такой мост безопасной передачи данных, который, например, понадобится для обновления табличных данных Excel, расположенных на локальном диске. Или для настройки обновлений. Подробнее о шлюзе мы также расскажем в статье про обновления данных. Или обратитесь к профессионалам, если не можете ждать.

Типы данных

Итак, мы подошли к самому интересному, к типам данных, с которыми «дружит» Power BI. Для Вашего удобства мы объединили их в группы – это файлы, пакеты содержимого и базы данных.

Если Вы расстроены малым количеством типов данных, к которым можно подключиться через Power BI непосредственно, ещё раз обращаем Ваше внимание на то, что используя Power BI Desktop, Вы получаете около полусотни новых возможностей. Просто это потребует чуть больше дополнительных действий. И, возможно, помощь специалиста.

Чтобы разом охватить максимальное количество данных, к которым вы можете получить доступ и не ограничиваться одним лишь Power BI, мы также расскажем о том, к чему можно получить доступ используя Power Bi Desktop. В нём загрузка данных разделена на категории «Файл», «База данных», «Azure» и «Другие».

Файлы

8_10Некоторые файлы загружаются в Power BI без проблем (например, Excel таблицы или PBI-файлы), некоторые (обычные .txt или таблицы .xml) – нужно сначала преобразовывать (мы писали об этом чуть выше).

Категория «Файл» в меню загрузки Power BI Desktop предлагает следующие варианты данных для подключения: Excel, CSV, XML, Текстовые, JSON и Папка.

Базы данных

8_11Power BI может подключаться как к локальным базам данных, так и к тем, что находятся в облаке. При этом подключения к облачным хранилищам являются динамическими, т.е. каждый раз, когда вы, например, создаёте визуализацию в отчёте, Power BI формирует запрос к набору данных. Для подключения к локальным базам данных необходим корпоративный шлюз Power BI. Для его настройки нужно обратиться к своему администратору (IT службе). Или, опять же, к профессионалам.

В настоящий момент Power BI Desktop предоставляет возможность подключениям к следующим базам данных: SQL Server, Access, SQL Server Analysis Services, Oracle, IBM DB2, MySQL, PostgreSQL, Sybase, Teradata и SAP HANA.

Пакеты содержимого

Пакет – это удобно. В пакете есть всё, что нужно для начала работы. Как, простите за сравнение, в суповом наборе. Набор (данных, на всякий случай, не суповой) может быть как загружен из разных служб (Google Analytics, например), так и создан (и опубликован) пользователем вашей компании.

На пользование пакетами часто есть ограничения. Так, для служб, это необходимость иметь учётную запись, а для организаций – это обязательность использования версии Power BI Pro.

Возможности Power BI Desktop

В завершении статьи мы кратко остановимся на тех возможностях подключения к данным, которые даёт Power BI Desktop:

 «Другие» данные Power BI Desktop

8_115Категория «Другие» включает в себя приличное количество возможных подключений: Веб-приложение, Список SharePoint, Веб-канал OData, Файл Hadoop (HDFS), Active Directory, Microsoft Exchange, Dynamics CRM Online, Facebook, Google Analytics, Объекты SalesForce, Отчеты SalesForce, ODBC и бета-версии следующих подключений: R Script, appFigures, GitHub, MailChimp, Merketo, QuickBooks Online, Smartsheet, SQL Sentry, Stripe, SweetIQ, Twilio, ZenDesk, Spark. Маловероятно, что начинающий изучать Power BI не найдёт тут необходимого. Кстати, при подключении к «Web», программа сама ищет информацию на странице и представляет её в режиме предварительного просмотра в области Навигатор. Выбирайте, что вам нужно, редактируйте, загружайте, работайте.

«Azure» Power BI Desktop

8_12Power BI Desktop обеспечивает солидные возможности по подключению и интеграции со службами Azure, поэтому этот вариант подключения данных даже выделен в отдельный раздел меню ми включает в себя следующие возможности для подключения: База данных Microsoft Azure SQL, Хранилище данных SQL Microsoft Azure, Microsoft Azure Marketplace, Microsoft Azure HDInsight, Хранилище BLOB-объектов Microsoft Azure, Табличное хранилище Microsoft Azure. И к перечисленному ещё три бета-версии продуктов: Azure HDInsight Spark, Microsoft Azure DocumentDB и Хранилище озера данных Microsoft Azure. В общем, сценариев функционального объединения Azure и Power BI достаточное количество.

Итог

Как видите, при должном количестве знаний, красивую и полезную аналитику с помощью Power Bi можно вытянуть из такого разнообразного количества источников данных, что мы даже и не знаем, чего тут может не хватать обывателю. Надеемся, вопросов по данным после прочтения этой статьи у Вас не осталось и в следующем обзоре мы расскажем об основных понятиях Power BI – о рабочей области и обо всём, что там находится и что со всем этим делать. Stay tuned.

Оставить комметарий

ПОДЕЛИТЬСЯ