Системи підтримки та прийняття рішень
ЛАБОРАТОРНА РОБОТА № 6
Багатовимірні та аналітичні звіти в пакеті Deductor Studio
Мета роботи – освоїти і закріпити навики створення сховища даних і отримання з нього інформації, побудови багатовимірних звітів, крос-діаграм і їх аналізу.
Завдання. Побудувати сценарії і на їх основі, а також за допомогою операцій транспонування вимірювань і агрегації фактів, сформувати звіти і відповісти на питання в завданнях.
Для виконання завдань знадобляться відомості з лабораторної роботи № 1 і додаткові обробники:
- перетворення дати/часу;
- фільтрація;
Обробник «Перетворення дати/часу»
Для більш якісного дослідження інформації, розміщеної у сховищі даних або отриманої з зовнішнього джерела, програма Deductor надає аналітику цілий ряд інструментів для обробки даних. Ці інструменти можуть бути застосовані до певного вузла сценарію за допомогою Майстра обробки, запуск якого здійснюється з панелі інструментів вкладки сценаріїв або за допомогою контекстного меню до потрібного вузлі на дереві сценаріїв (рис. 6.1). У діалоговому вікні майстра обирається потрібний метод, і на подальших кроках уточнюються особливості схеми обробки даних. Одним з таких алгоритмів є обробник «Дата и время», призначений для розбиття дати на складові.
Рис. 6.1 – Виклик майстра обробки
Розбиття дати дозволяє проводити аналіз показників за певний період (день, тиждень, місяць, квартал, рік). Суть розбиття полягає у тому, що на основі стовпця з інформацією про дату, що відноситься до рядка запису у таблиці чи базі даних, формується інший стовпець, в якому указується, до якого заданого інтервалу часу належить рядок даних. Тип інтервалу задається аналітиком, виходячи з того, за який період є потреба аналізу даних – дані за рік, квартал, місяць, тиждень, день або відразу за всіма інтервалами.
Значення нового стовпця, одержаного після застосування перетворення дати, можуть бути одного з трьох типів: рядок, число або дата. Тип такого перетворення обирається аналітиком на відповідному кроці роботи Майстра.
Наприклад, потрібно перетворити дату «7.01.2003» і замінити її значенням типу «рік-місяць» і додатково визначити, до якого кварталу календарного року відноситься ця дата.
Тоді в стовпці рядкового типу результатів роботи Майстра міститиметься запис «2003-М01» і його вже не можна використовувати як дату, наприклад, до нього не можна знову застосувати перетворення дати. А в стовпці типу «Дата (Квартал)» буде розміщено число 1 (рис. 6.2).
Рис. 6.2 – Результати роботи Майстра обробки «Дата и время»
Обробник «Фільтрація»
За допомогою операції фільтрації можна залишити в таблиці, призначеній для подальшої роботи, тільки ті записи, які задовольняють заданим умовам, а інші приховати. Слід відзначити, що фільтрація даних здійснюється як окремий вузол на дереві сценарію за допомогою відповідного Майстра обробки. Програма надає аналітику досить широкі можливості по фільтрації даних, дозволяючи задавати одночасно декілька умов відбору даних. Для кожної такої умови програмою задаються відповідні критерії (рис. 6.3).
Рис. 6.3 – Визначення умов для фільтрації даних
За встановленими параметрами інформація з джерела даних буде занесена до таблиці, OLAP-кубу або відображена графічно. Створені у подальшому вузли сценарію у якості вхідної інформації будуть використовувати відфільтровані дані.
Додаткові можливості для фільтрації даних, представлених у крос-таблиці або OLAP-кубі, встановлюються за допомогою фільтрів користувача на відповідних вкладках у правій частині робочої області програми. Слід мати на увазі, що незважаючи на однаковий вигляд піктограм на вкладках, для відбору даних у таблиці та в OLAP-кубі застосовуються різні інструменти – відповідно «Фильтрация….» та «Селектор…». Ці інструменти надають користувачу різні можливості для відображення даних: якщо діалогове вікно визначення фільтру для таблиці подібне до вікна Майстру обробки «Фильтрация», то вигляд і умови фільтрації діалогового вікна селектора залежать від типу даних, за якими встановлюється фільтр – виміри це чи факти (рис. 6.4).
Рис. 6.4 – Діалогове вікно Селектора
І навіть після встановлення фільтру користувач може задавати додаткові умови для перегляду даних в кубі. Це можна здійснити після натиснення на піктограму «Детализация…» у нижній частині кубу. Вікно для встановлення фільтрації відображається знизу від крос-таблиці. При натисненні на піктограму «Фильтрация…» відкривається діалогове вікно настроювання умов фільтрації, у якому користувач має змогу побудувати власний фільтр для даних у крос-таблиці (рис. 6.5).
Рис. 6.5 – Встановлення додаткового фільтру
Додаткова інформація по використанню перетворення та фільтрації даних можна знайти у файлі «Руководство аналітика.pdf» (див. Лаб. Роботу №5)
Робота із зовнішньою базою даних
Для проведення аналізу можна використовувати не тільки бази даних у окремих таблицях (файлах), але й більш розгалужені бази даних, що складаються з декількох таблиць (наприклад, база даних MS Access). Для підключення такої бази даних до програми і подальшої роботи з нею необхідно скористатися майстром підключення даних («Источники данных») і вибрати у якості джерела тип бази даних. Виконання цієї команди приведе до появи діалогового вікна встановлення типу даних, що будуть підключені (наприклад, MS Access) після чого у вікні підключення файлу бази даних необхідно вказати шлях до нього. Для подальшої роботи можна використовувати інформацію, що знаходиться у таблицях підключеної бази даних.
Порада: при підключенні бази даних рекомендується зняти опцію запиту пароля при відкритті та доступу до бази.
Розглянемо, наприклад, імпорт інформації з таблиці «Сотрудники» бази даних «Борей».
Після підключення до цієї бази за допомогою Майстра імпорту створюється новий вузол, джерелом даних якого буде база даних.
На другому кроці майстра імпорту з списку доступних баз даних обирається потрібна БД, а на третьому кроці роботи майстра встановлюють спосіб отримання інформації з БД: таблиця, запит до БД чи файл з текстом запиту до БД. У нашому прикладі оберемо способом отримання інформації «Таблица / Представление базы данных». Наступний крок роботи Майстра імпорту дозволяє встановити, з якої саме таблиці будуть імпортовані дані.
На наступних кроках майстра імпорту встановлюються параметри та спосіб відображення даних з підключеної таблиці. У результаті виконання таких дій користувач матиме змогу отримувати для роботи інформацію з підключеної таблиці бази даних.
За таким же сценарієм можна виконати імпорт даних з декількох таблиць БД або декількох БД для подальшого злиття, обробки та аналізу інформації.
Інколи при об’єднанні даних декількох таблиць буває необхідним перевизначити назви стовпців у таблиці з даними. Для цієї мети можна скористатися Майстром обробки –Настройка набора данных – і у полі «Метка столбца» (крок 2 з 4) ввести потрібну назву та при необхідності встановити призначення того чи іншого стовпчика у отриманому наборі даних.
При роботі з майстром візуалізації користувач має змогу вибирати ті поля, дані з яких потрібні для аналізу. Для зайвих полів таблиці слід встановити при цьому опцію:Назначение – Неиспользуемый.
Завдання до роботи
Завдання 1.
Робота з документацією по програмі Deductor
1.1. Ознайомитись з інформацією про призначення та створення та редагування структури сховища даних, а також процедури завантаження інформації до сховищ даних.
1.2. Ознайомитись з особливостями роботи з OLAP-кубами у програмі Deductor.
Завдання 2.
Розробка сценарію по створенню OLAP-куба з зовнішнього джерела даних.
2.1. Імпортувати до програми інформацію з текстового файлу Credit.txt який містить інформацію про надані банківською установою кредити.
2.2. За допомогою майстра обробки створити сценарій перетворення дати і часу для поля імпортованої таблиці «Дата кредитования» , виконавши розбиття за тижнем (як рядок) і днем тижня (як число).
2.3. За допомогою майстра візуалізації та створення відповідних фільтрів створити крос-таблиці (OLAP-куби) та крос-діаграми для відповіді на наступні питання:
- визначити суму та кількість кредитів, виданих по тижням в залежності від статі отримувачів
- визначити суму кредитів, отриманих жінками протягом першого тижня від наявних даних для сплати туристичних поїздок та розваг
- визначити кількість кредитів, отриманих для сплати за навчання особами з вищою освітою протягом першого тижня від наявних даних
- визначити суму та кількість кредитів, отриманих 4 та 10 січня 2003 року з метою купівлі та ремонту нерухомості чоловіками, що знаходяться у шлюбі
- визначити кількість клієнтів віком понад 35 років, які отримали кредит і працюють на керівних посадах
Завдання 3.
Організація OLAP-кубів у сховищі даних.
Взявши у якості джерела інформації базу даних «Борей», потрібно:
3.1. Підключити базу даних для подальшої роботи.
3.2. Створити на локальному диску (робочому місці) сховище даних «DSS_Lab_6_(власне прізвище)»
3.3. Організувати структуру сховища та його наповнення таким чином, щоб у якості фактів, вимірів та їх атрибутів у сховищі містилась інформація, отримана після злиття наступних таблиць БД «Борей»: «Товары», «Типы», «Заказано», «Заказы».
Структура таблиць з описом кожного полів:
3.4. Створити у сховищі даних OLAP-куби і, використовуючи при необхідності Майстер обробки «Фильтрация», за допомогою Майстра візуалізації за допомогою створених кубів дайте відповіді на наступні питання:
1. Яка торгова точка забезпечує найбільшу суму продажу? Яка товарна група має максимальну суму продажу? Побудуйте крос-діаграму сум продажу: загальний обсяг, продаж по країнах, продаж по товарних групах.
2. Те ж, що в п.1, але за останні три місяці від наявних даних.
3. Те ж, що в п.1, але за останні три тижні від наявних даних.
4. Знайти суму максимальної і середньої вартості купівлі товару за останній місяць від наявних даних.
5. Сформувати багатовимірний звіт і графік кількості і обсягів продажу товарів по країнам за днями. На які дні доводяться піки продажів?
6. Те ж, що в п. 5, але за три місяці від наявних даних.
7. Сформувати багатовимірний звіт і графік кількості і обсягів замовлень по країнам по днях тижня.
8. Те ж, що в п. 7, але за останній місяць від наявних даних.
9. Сформувати багатовимірний звіт і графік кількості і обсягів замовлень країн по днях місяця. Побудуйте лінію тренда.
10. Те ж, що в п. 9, але за останні три місяці від наявних даних.
11. Визначте перелік 20 товарів, що продаються даною фірмою.
12. Те ж, що в п. 11, але за останні три тижні від наявних даних.
13. Визначте перелік 10 товарів, що продаються, по четвергах.
14. Визначте перелік 5 найпопулярніших товарів в кожній товарній групі.
15. Те ж, що і п. 14, але за останній тиждень.
16. Товари, що дають 50% від загального обсягу продажу.
17. Те ж, що і п. 16, але за останній місяць від наявних даних.
18. Те ж, що і п. 16, але за останній тиждень.
3.5. Результати звітів (таблиці) необхідно експортувати у MSWord.
Розподіл питань по варіантах.
Завд.
|
Варіант
| ||||||||||||||
1
|
2
|
3
|
4
|
5
|
6
|
7
|
8
|
9
|
10
|
11
|
12
|
13
|
14
|
15
| |
1
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||
2
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| ||||||||
3
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||||
4
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| |||||
5
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||||
6
|
+
|
+
|
+
|
+
|
+
| ||||||||||
7
|
+
|
+
|
+
|
+
|
+
| ||||||||||
8
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||||
9
|
+
|
+
|
+
|
+
| |||||||||||
10
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||||
11
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||||
12
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||||
13
|
+
|
+
|
+
|
+
|
+
| ||||||||||
14
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||
15
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||
16
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||
17
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
| |||||||
18
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
+
|
Звіт по роботі повинен містити назву, мету, перелік завдань та результати і алгоритм їх виконання.
Немає коментарів:
Дописати коментар