17. května 2016

Záznam přednášky - Power BI live vs Import & security

Ve středu 11.5. se v Praze v prostorách společnosti Microsoft uskutečnilo setkání české BI & SQL PASS chapter (kdyby Vás zajímaly další akce, koukněte na Meetup http://www.meetup.com/CZBISQLPASS/), kde jsem měl to potěšení přednášet. Stěžejním tématem, kterému jsem se chtěl věnovat byly problémy spojené s Power BI při nasazení v korporátním prostředí. Porovnával jsem živé připojení proti importu dat a také jsme si ukázali, jak zabezpečit, aby každý uživatel viděl jen relevantní obsah. Ztěžejní témata tedy byly, jak tedy bylo zcela zřetelně napsáno v anotaci přednášky: Import vs Live a Row Level Security (RLS).
Video z akce najdete na konci článku (lehce ořezané o části, kde nebyl slyšet zvuk při představení PASSu a závěrečné diskuzi).
Protože RLS jsem se věnoval v samostatných článcích (Import - http://www.neoral.cz/2016/04/power-bi-role-zabezpeceni.html a Live http://www.neoral.cz/2016/03/power-bi-enterprise-gateway-direct.html), těmito tématy se v dnešním článku do hloubky zaobírat nebudu. Protože už nás na závěr trochu tlačil čas, rád bych se vrátil do fáze manažerského shrnutí :)
Případné nezodpovězené dotazy z přednášky i momo zmůžete klást do komentářů pod článkem, odpovím.

Někdy otázku jestli živé připojení, nebo import může může Power BI rozhondnout za vás, protože zrovna ve vašem případě nemusí být z čeho vybírat. 

Technické faktory pro rozhodování jsou následující

Zdroje
V současné době se dá živým připojením připojit pouze do vybraných zdrojů, jsou jimi (Analysis Services, SQL Server, SAP Hana, Oracle, Teradata a v preview SAP BW. Pokud navíc zdroj není v cloudu. Musíte mít nainstalovanou Enterprise Gateway (http://www.neoral.cz/2016/03/power-bi-enterprise-gateway-direct.html) a byť jsem se to nikde explicitně nedočetl (možná se od té doby již změnila dokumentace), tak tato brána mi nešla nainstalovat na PC, který nebyl v doméně.
Brány
Navíc aktualizace přes enterprise i personal gateway vyžadují Power BI Pro licenci. Na seznam vlastností, které Vás donutí pořídit Pro verzi se můžete podívat zde: https://powerbi.microsoft.com/en-us/documentation/powerbi-power-bi-pro-content-what-is-it/
Frekvence
Importovat data lze maximálně 8 krát denně (s výběrem, celá hodina/o půl) a nejde se spolehnout na časy aktualizací, že se spustí přesně v nastavenou dobu. Chcete-li aktualizovat data častěji jak 8 krát denně a máte nároky na to, kdy přesně má dojít k aktualizaci. Musíte data aktualizovat u vás ve firmě a koukat na data přes Power BI živým připojením.
Velikost dat pro upload
Existovalo omezení 250 MB na soubor. Jedná se sice o komprimovaná data, ale tahat nějaké desítky GB do cloudu za účelem reportingu stejně pravděpodobně není potřeba (lepší v režimu import naplnit jen ta data, která skutečně potřebujete dostat do reportu). Pokud máte data větší, je lepší je nechat u vás ve firmě a připojovat se do živých přes Enterprise Gateway.
--poznámka 17.5. maximální velikost zvednuta na 1GB
Vliv na výkon zdrojového systému
Pokud byl váš zdrojový systém křehký jak skleněná růže před přímým připojením z Power BI. Živým připojením výkonu nepomůžete :)
Recyklace logiky (výpočty, zabezpečení, ...)
Pokud děláte něco dá se říci unikátního, s importem nemusí být problém. Pro opakované použití stejné logiky, může být výhodnější použít živé připojení do modelu, který má v sobě již tuto logiku předpřipravenou (výpočty, Row Level Security)
Potřebuji kombinovat?
Pokud  použijete živé připojení, už data nemáte v současném stavu jak nakombinovat s dalším zdrojem. To lze pouze u importu.

Mé osobní preference 
Zaměřím se na nejčastější typy zdrojů z dílny společnosti Microsoft, SQL Server a OLAP kostky. 
Operativní reporting
Nad systémem, který běží na MS SQL Serveru. Otázka zní, jestli je pro tuhle aplikci Power BI vhodný nástroj. Import zde vesměs použít nemohu. 8 krát za den je s nespolehlivým časováním je málo. S živým připojením opatrně pokud se jedná o výše zmiňovanou skleněnou růži. U živého připojení můžu vybrat jen některé objekty, ale tak jak jsou (už je dále nezafiltruji). S živým připojením nemohu napsat do zdrojové databáze Select, který vybere co chci (lze jen u importu). Aby to mohlo fungovat, museli bychom si nachystat v databázi vrstvu views, které by vracely jen data potřebná pro report. Klidnější bych také byl, kdyby ve zdroji šlo použít operational analytics ze SQL Serveru 2016.
BI reporting za účelem podpory rozhodování
Kvůli tomu, že jeden report většinou nestačí a stejnou logiku budeme potřebovat ve více reportech, preferoval bych nachystat logiku jednou a využívat ji opakovaně. Takže v ideálním případě postavit datový sklad, nad skladem model v SSAS. V modelu nastavit zabezpečení a dotazovat se živým připojením do dat v modelu.V modelu bych ale musel mít nachystané úplně vše. Živé připojení mi neumožní přidat data od jinud. Stejně tak mi zatím neumožní dodělávat počítané sloupce a měřítka (což mi znatelně chybí, podpořte prosím nápad na User Voices, ať se dočkáme https://ideas.powerbi.com/forums/265200-power-bi-ideas/suggestions/11685723-create-calculated-measures-on-top-of-a-live-ssas-c)
Kdy tedy import
Když mi nevadí, že data nejdou aktualizovat příliš často. Sahám na data, která nemám všechny na jednom místě a tak musím kombinovat s dalšími zdroji. Pokud by dotaz do živých dat byl zbytečným drážděním už tak vytíženého zdroje dalším analytickým dotazem. 

Záznam přednášky

Závěr
V přednášce i dnešním článku jsem se snažil shrnout pro a proti režimu živého připojení a importu dat do Power BI služby. Jako vždy, při výběru je potřeba vycházet z požadavků a omezení jednotlivých způsobů. A protože mezi importem a živým připojením nejde plynule přepínat, je dobré se hned na začátku rozhodnout správně :) Snad vám dnešní článek ulehčí rozhodovací proces.

Žádné komentáře:

Okomentovat