Cloud Wars: Datenvisualisierung [Teil 5]

Gepostet am: 22. September 2016

Von  und 

In diesem Artikel untersuchen wir die Methoden, die AWS, Azure und Google Cloud zur Visualisierung von Daten anbieten. Abschließend ziehen wir ein Gesamtfazit unserer Artikelserie, die sich ausführlich mit den drei großen Cloud-Anbietern beschäftigt hat.

Azure vs. AWS vs. Google Cloud

Alle Tools, die wir im Rahmen dieser Serie beleuchten.

Nachdem die Daten bereits vorverarbeitet und in entsprechende Systeme zur Analyse geladen wurden, werden Tools benötigt für die visuelle Analyse und Darstellung der Daten. Dazu werden von BI-Abteilungen üblicherweise spezialisierte Front-End Tools verwendet, um Dashboards mit KPIs, Diagrammen und Metriken bereitzustellen. Interaktive Reports ermöglichen explorative Einblicke und Erkenntnisse aus den Daten in Echtzeit. In unseren Tests wurden nur Tools vom jeweiligen Cloud Provider betrachtet, also keine Drittanbieter. Diese können natürlich immer verwendet werden, wenn ein entsprechender Datenbankentreiber für das Backend verfügbar ist oder das Tool eine Direktanbindung unterstützt.

aws

Amazon Quicksight

Amazon QuickSight: Very fast, easy-to-use, cloud-powered business intelligence (BI) service.

Visualisierung mit AWS

AWS QuickSight ist ein in der Cloud verfügbarer BI-Visualisierungs-Service, mit dem sich Dashboards schnell erstellen lassen. Besonders gut eignet sich QuickSight natürlich bei Redshift- oder RDS-Insatzen, die automatisch erkannt werden und schnell verbunden werden können.

Selbstverständlich können für Ad-hoc Reporting auch CSV Sheets geladen und visualisiert werden. QuickSight lädt die zu visualisierende Daten der Dashboards in den Arbeitsspeicher und verarbeitet sie parallel, was kurze Antwortzeiten verspricht. Um schneller Reports zu erstellen, Hilft QuickSight bei der Auswahl von Visualisierungen, indem es entsprechend der bekannten Datentypen Empfehlungen gibt. Die Dashboards können für Nutzer oder Gruppen freigegeben werden. Der Zugriff ist auch für Mobilgeräte optimiert.

Aktuell befindet sich der Dienst in einer Closed-Beta-Phase, er soll aber noch im Laufe dieses Jahres verfügbar sein. Alternativ lassen sich Visualisierungstools von einigen Drittanbietern auch über den AWS Marketplace beziehen.

Einsatz im Use Case

QuickSight kann direkt auf die Redshift-Tabellen konfiguriert werden und die Daten entsprechend anzeigen. Da wir keine Materialen aus der Closed Beta zeigen dürfen, sei an dieser Stelle lediglich auf die Screenshots zur Illustration auf der offiziellen QuickSight-Pruduktseite hingewiesen.

Bar Chart

azure

MS Power BI

Power BI & Power BI Embedded: A suite of business analytics tools to analyze data and share insights.

Visualisierung mit Microsoft

Schon 2014 hat Microsoft mit Power BI eine leistungsgerechte Self-Service-BI-Lösung in die Cloud gebracht. Die Integration von Power BI ist dank einer großen Bandbreite an unterstützten Datenquellen (Cloud-Dienste, Streaming-Daten aber auch lokale Daten) hervorragend. Für eine ganze Bandbreite an weitverbreiteten SaaS-Diensten wie Google Analytics und Salesforce bietet PowerBI optimierte Konnektoren, die das Verbinden noch schneller und einfacher machen. Die Datenvisualisierung ist durch eine große Auswahl an Diagrammtypen, Karten und Tabellen möglich. Durch offene Schnittstellen und eine aktive Community sowie die Integration von R bleiben kaum Wünsche offen. In der Power-BI-Desktop-Version lassen sich Dashboards besonders gut konfigurieren. Für das Konsumieren der Reports stehen neben der WebApp auch Apps für die gängigen mobilen Betriebssysteme bereit. In den interaktiven Dashboards können sogar Fragen mit natürlicher Sprache formuliert werden, welche von Power BI durch interaktive Visualisierung beantwortet werden.

Power BI ist eigentlich ein Tool der Productivity Cloud (Office 365), mit Power BI Embedded ist aber seit kurzem auch die direkte Integration in die Azure Backend Services möglich.

Einsatz im Use Case>

In Power BI wird von den Azure Stream Analytics ein Dataset mit Echtzeitdaten bereitgestellt. Die Datenquelle taucht nach Eingabe der korrekten  Zugangsdaten in der Power BI Web App auf. Dann lassen sich die Daten recht einfach zum Erstellen eines Reports nutzen. Neben dem Echtzeit-Dashboard wurde ein Dashboard für die im SQL-Data-Warehouse gespeicherten Daten erstellt.

Im folgenden Video zeigen wir zunächst die in Stream Analytics hinterlegte Abfrage, die das Dataset in Power BI für die Realtime-Daten erzeugt bzw. aktualisiert, sobald der Job gestartet wird. In der Power-BI-Web-Oberfläche (nicht im Power BI Desktop) erscheint dieses Dataset dann und kann verwendet werden, um Daten auf unterschiedliche Art und Weise zu visualisieren. Für das Push Dataset können im Dashboard über Q&A dann auch nützliche Funktionen wie „last 10 seconds“ genutzt werden, um die angezeigten Daten weiter zu schneiden.

google-cloud

Google Data Studio 360

Google Data Studio 360: Turns your data into beautiful, informative reports that are easy to read, easy to share, and fully customizable.

Visualisierung Google

Wie bei Amazon befindet sich auch Google Data Studio noch in der Beta-Phase. Die auf der Website verfügbaren Beispiel-Reports versprechen ansprechende und interaktive Analysen. Der Dienst ist derzeit allerdings nur für Benutzer in den USA verfügbar. Auch Google bietet neben Konnektoren für die eigenen Services wie Big Query und AdWords auch SQL-Anbindungen für Services anderer Anbieter. Die Reports lassen sich flexibel freigeben und teilen.

Einsatz im Use Case

Zur Zeit unserer Research-Aktivitäten war der Zugriff leider noch nicht möglich, da in der Beta keine eigenen Datenquellen angebunden werden können. Dennoch zeigen wir im Folgenden eine Demo, die natürlich aus den o.g. Gründen noch nicht auf den Use Case zugeschnitten ist.

Bewertung der Dienste für Datenvisualisierung

Amazons QuickSight soll in diesem Jahr erscheinen. Die Closed Beta wurde getestet, AWS hat allerdings einen NDA auf die Version, weshalb wir keinerlei Details nennen dürfen. Power BI ist dagegen schon länger auf dem Markt und bietet ein ausgereiftes Produkt, das bereits bei vielen Kunden im produktiven Einsatz ist. Google schließlich bringt mit Data Studio 360 Kürze* ein neues, auf den ersten Blick ebenfalls ansprechendes Produkt auf den Markt. Besonders für Kunden, die bereits Google Analytics für ihre Mobile- oder Web-Lösungen einsetzen, eröffnen sich dadurch noch mehr Möglichkeiten.

*(Zeitpunkt der Evaluation war Juni 2016)

QuickSight PowerBI Google Data Studio 360
Bedienung: ☆+

Möglichkeiten: ☆+

Bedienung: ☆☆☆

Möglichkeiten: ☆☆☆

Bedienung: ☆+

Möglichkeiten: ☆+

Gesamtfazit der Cloud Provider

Nachdem der komplette Use Case mit den Diensten des jeweiligen Cloud-Anbieters umgesetzt wurde und die dabei gesammelten Erkenntnisse in den einzelnen Teilen des Blogs gegenübergestellt wurden, soll an der Stelle auch der Gesamteindruck zusammenfasst werden.

Alle drei betrachteten Cloud-Anbieter bieten eine breite Palette an Services zum Thema Data Management & Analytics. AWS hinterließ in fast allen Bereichen einen guten Eindruck: Mit Kinesis Firehose konnten die Daten schnell geladen werden und die Umsetzung von Transformationen mit Hive über die Data Pipeline verlief problemlos. Das Release von Kinesis Streams und QuickSight verspricht Spannung für die Zukunft.

Azure konnte sowohl bei Stream Analytics mit der SA-QL als auch seiner Data-Lake-Analytics-Lösung mit U-SQL Pluspunkte sammeln. Bei der Orchestrierungslösung Data Factory hat Microsoft vor allem hinsichtlich der Bedienung noch Nachbesserungsbedarf. Dennoch ist Microsoft mit Power BI der Konkurrenz hier weit voraus: Besonders gut klappte hier der „schnelle  System-Durchstich“ von Data Ingestion bis in Power BI mit wenigen Klicks und überschaubarem Programmieraufwand.

Auf Googles Cloud Plattform konnte Big Query besonders überzeugen. Dataflow ist eine sehr spannende und leistungsstarke Lösung, konnte aber in Bezug auf den Blickwinkel Data Management und Analytics wegen des notwendigen Java Codings nicht ganz überzeugen: Ein PaaS-Anbieter sollte an dieser Stelle schon etwas mehr Komplexität vom Benutzer wegkapseln. Das ist jedoch nicht nur als Nachteil zu sehen, denn das Programmiermodell ist leistungsstark, die Platform skaliert und Java-Entwickler werden sich dort gut zurechtfinden.

AWS Azure GCP
Streaming ☆☆ ☆☆☆ ☆☆
Orchestrierung ☆☆+ ☆☆
Analytical Data Store ☆☆ ☆☆+ ☆☆+
Datenvisualieierung + ☆☆☆ +

Eine dazu recht passende Einschätzung der Cloud Services Provider liefert Rene Brüst:

„Unterm Strich lässt sich sagen, dass Microsoft aufgrund seiner PaaS-Historie technologisch in diesem Bereich einen deutlichen Vorsprung hat. Amazon AWS hingegen ist derzeit noch der unumstrittene Innovations- und Marktführer im IaaS-Umfeld.“

Microsoft Azure liefert das insgesamt stimmigste Gesamtbild für unseren Anwendungsfall. AWS war hier an einigen Stellen zwar etwas „hemdsärmelig“, bietet aber ebenfalls leistungsstarke Services. Google bietet als einer der Pioniere im Big Data Business ebenfalls sehr flexible und skalierbare Lösungen. So ist Spotify als bisheriger AWS Kunde auch wegen der „data platform and tools“ zu Google gewechselt.

Die Wahl des Cloud Providers ist nicht zuletzt auch eine Glaubensfrage. Der Provider sollte entweder zum bisherigen Technologie-Stack eines Unternehmens passen oder Teil einer durchdachten Multi-Vendor-Strategie im Cloud-Bereich sein, wie sie immer mehr Unternehmen anwenden.

Weiterlesen

Auf unserer Website stellen wir unser komplettes Dienstleistungsportfolio rund um den Themenbereich Analytics vor. Bei Fragen freuen wir uns auch über direkten Kontakt in den Kommentaren, per Mail an info@inovex.de oder telefonisch unter +49 721 619 021-0.

Die Blog-Serie im Überblick:

  1. Einleitung, Vergleich des Look & Feel sowie Vorstellung von Use Case & Architekturen
  2. Collection und Storage
  3. Computation
  4. Analytical Data Stores
  5. Data Presentation und Fazit (dieser Artikel)

Join us!

Wir suchen Verstärkung für unser Analytics-Team! Egal ob Cloud Solution Architect, Junior oder Senior Big Data Scientist oder BI-Experte: Wir freuen uns auf Bewerbungen!

2017-11-27T15:30:29+00:00