In die Kategorie Analytics fallen sowohl die klassischen Data-driven-Business / BI-Themen (Data Warehouse, ETL, Reporting, Dashboards) als auch die neueren Trends in diesem Umfeld: Big Data, Data Science & Deep Learning und Search-based Applications.

Wir verstehen uns als Spezialist für anspruchsvolle Aufgaben in den Bereichen Data Management und Analytics, die unter Zeitdruck gelöst werden müssen und für die oftmals in den Unternehmen keine eigenen Fachleute verfügbar sind:

  • die Modellierung hochkomplexer Cubes,
  • die Integration heterogener Datenquellen,
  • der effiziente Umgang mit sehr großen Datenvolumina (Big Data),
  • die wissenschaftliche Analyse dieser Daten-Pools (Data Science) und
  • der Einsatz von innovativen Suchtechnologien im Unternehmenskontext.

Was kostet die Cloud? (und warum das keiner so richtig genau sagen kann)

2019-04-10T16:23:03+00:00

Diese Frage wird uns oft gestellt im Zusammenhang mit der Kosten-Kalkulation für Projekte, deren Infrastruktur auf Public-Cloud-Diensten basiert. Allerdings ist es leider oft ein komplexes Unterfangen, diese Kosten zu bestimmen. Warum das so ist möchte ich in diesem Blog Artikel erläutern.

Diese Frage wird uns oft gestellt im Zusammenhang mit der Kosten-Kalkulation für Projekte, deren Infrastruktur auf Public-Cloud-Diensten basiert. Es ist verständlich,

Was kostet die Cloud? (und warum das keiner so richtig genau sagen kann) 2019-04-10T16:23:03+00:00

Frameworks for Machine Learning Model Management

2019-04-04T10:02:24+00:00

This blog post will compare three different tools developed to support reproducible machine learning model development: MLFlow developed by DataBricks (the company behind Apache Spark), DVC, a software product of the London based startup iterative.ai, and Sacred, an academic project developed by different researchers.

In my previous blog post „how to manage machine learning models“ I explained the difficulties within the process of developing a good machine learning mod

Frameworks for Machine Learning Model Management 2019-04-04T10:02:24+00:00

Deep Learning Fundamentals: Concepts & Methods of Artificial Neural Networks

2019-04-02T13:34:12+00:00

Everybody talks about AI and deep learning and everybody uses it, including you! But what exactly is deep learning and what are artificial neural networks? In this article I shine a light on some basic yet crucial concepts in an attempt to lift the veil.

Artificial intelligence or deep learning: Everybody talks about it and everybody uses it, including you! Of course you immediately have the evil terminator in mind wh

Deep Learning Fundamentals: Concepts & Methods of Artificial Neural Networks 2019-04-02T13:34:12+00:00

Price Prediction in Online Car Marketplaces using Natural Language Processing

2019-04-02T13:35:55+00:00

I use state-of-the-art NLP techniques to improve an existing pricing model in an online car market. Online car markets usually use technical car attributes for price prediction with sellers adding description texts to provide more details. In my thesis, I use these texts to improve the existing pricing model.

tl;dr: This blog post summarizes my masters‘ thesis. I use state-of-the-art NLP techniques to improve an existing pricing model in an online car market. Online

Price Prediction in Online Car Marketplaces using Natural Language Processing 2019-04-02T13:35:55+00:00

Machine Learning Interpretability: Do You Know What Your Model Is Doing?

2019-04-02T13:36:57+00:00

Unlike usual performance metrics, fairness, safety and transparency in machine learning models are much harder if not impossible to quantify. Here are some techniques (and examples) to provide interpretability, to make decision systems understandable not only for their creators, but also for their customers and users.

Machine learning has a great potential to improve data products and business processes. It is used to propose products and news articles that we might be interested i

Machine Learning Interpretability: Do You Know What Your Model Is Doing? 2019-04-02T13:36:57+00:00

SeqPolicyNet: Querying Elasticsearch by Asking Questions about Movies

2019-04-02T13:39:46+00:00

This article presents SeqPolicyNet, our Deep Learning approach to accessing information stored in an Elasticsearch instance given natural language questions.

tl;dr (spoiler alert): We’ve trained an advanced neural network to query Elasticsearch based on natural language questions. Our model, called SeqPolicyNet, incorporat

SeqPolicyNet: Querying Elasticsearch by Asking Questions about Movies 2019-04-02T13:39:46+00:00

Hybride DWH-Architekturen: Mehrwerte von Cloud Services (Teil 3)

2019-01-11T17:26:38+00:00

Eignen sich hybride DWH-Architekturen für Szenarien mit global verteilten Daten? Wie wird die Ausfallsicherheit in der Cloud sichergestellt und welche Herausforderungen und Risiken ergeben sich? Unser Fazit zu hybriden DWH-Architekturen.

Kürzlich wurde das Buch BI & Analytics in der Cloud im dpunkt Verlag veröffentlicht, in dem von verschiedenen Fachautoren des TDWI die Besonderheiten zu Cloud Bus

Hybride DWH-Architekturen: Mehrwerte von Cloud Services (Teil 3) 2019-01-11T17:26:38+00:00

Hybride DWH-Architekturen: Mehrwerte von Cloud Services (Teil 2)

2019-01-16T09:01:44+00:00

Wie lassen sich hybride Technologien im Data-Warehouse kombinieren? Wie tragen erhöhte Agilität und schnelle Innovationszyklen der Hersteller zur Optimierung von Betriebskosten im Cloud-Kontext bei? Teil 2 unserer dreiteiligen Artikelserie über hybride DWH-Architekturen.

Kürzlich wurde das Buch BI & Analytics in der Cloud im dpunkt-Verlag veröffentlicht, in dem von verschiedenen Fachautoren des TDWI die Besonderheiten zu Cloud Bus

Hybride DWH-Architekturen: Mehrwerte von Cloud Services (Teil 2) 2019-01-16T09:01:44+00:00

Hybride DWH-Architekturen: Mehrwerte von Cloud Services (Teil 1)

2019-01-16T09:01:39+00:00

Wie passen Cloud und Data-Warehousing zusammen, wie wird Connectivity in die Cloud hergestellt und welche Skalierungsmöglichkeiten und Chancen ergeben sich dadurch? Teil 1 unserer dreiteiligen Artikelserie über hybride DWH-Architekturen.

Kürzlich wurde das Buch BI & Analytics in der Cloud im dpunkt-Verlag veröffentlicht, in dem von verschiedenen Fachautoren des TDWI die Besonderheiten zu Cloud Bus

Hybride DWH-Architekturen: Mehrwerte von Cloud Services (Teil 1) 2019-01-16T09:01:39+00:00

Grafana Loki: Scalable and Flexible Logfile Management

2019-01-22T07:27:51+00:00

Loki is a logfile aggregator that collects log streams. It does so by storing log streams as well as labels attached to them. Loki works like Prometheus, but for logs. Each log stream is indexed and its occurrence is tracked via a timestamp.

Right now there are three popular platforms to build a scalable and flexibel logfile management solution on-premise: splunk, elastic stack and graylog. Most customers

Grafana Loki: Scalable and Flexible Logfile Management 2019-01-22T07:27:51+00:00

Deep Learning Fundamentals

2019-04-02T13:39:35+00:00

This article unveils the connections between artificial intelligence, machine learning and deep learning based on a simple example. It suits as an introduction for newbies as well as a reference point for advanced readers looking for more complex content.

There has always been a gap between the capabilities of men and machine. While computers were able to perform complex multiplications or store large amounts of data,

Deep Learning Fundamentals 2019-04-02T13:39:35+00:00

MLaaS: Maschinelles Lernen in der Cloud

2019-04-02T13:40:24+00:00

Machine learning as a service (MLaaS) bietet Unternehmen eine einfache Möglichkeit, Daten zu verarbeiten, Modelle zu trainieren und Prognosen zu erstellen. In diesem Artikel werden die Angebote von vier der größten Cloud-Anbieter vorgestellt: GCP, AWS, MS Azure und IBM Cloud/Watson.

Cloud Computing gewinnt durch sein flexibles Bereitstellungsmodell immer größere Bedeutung. Von Software (SaaS),Plattformen (PaaS) bis hin zur IT-Infrastruktur (IaaS)

MLaaS: Maschinelles Lernen in der Cloud 2019-04-02T13:40:24+00:00

Traditionelles vs. virtuelles Data Warehouse: Vergleich der ETL-Performance

2018-11-26T10:06:11+00:00

Durch die Virtualisierung von ETL-Prozessen kann eine DWH-Architektur an Flexibilität gewinnen, allerdings resultiert daraus eine reduzierte Performanz. Hier sind die Ergebnisse meiner Masterarbeit, in der ich diesen Trade-off eines virtuellen Data Warehouse untersucht habe.

Durch die Virtualisierung von ETL-Prozessen kann eine Data-Warehouse-Architektur an Flexibilität gewinnen, der daraus resultierende Nachteil ist eine reduzierte Perfo

Traditionelles vs. virtuelles Data Warehouse: Vergleich der ETL-Performance 2018-11-26T10:06:11+00:00

Working efficiently with Jupyter Notebooks

2018-11-20T11:31:51+00:00

Being in the data science domain for quite some years, I have seen good Jupyter notebooks but also a lot of ugly ones. Follow these best practices to to work more efficiently with your notebooks and strike the perfect balance between text, code and visualisations.

If you have ever done something analytical or anything closely related to data science in Python, there is just no way you have not heard of or IPython or Jupyter not

Working efficiently with Jupyter Notebooks 2018-11-20T11:31:51+00:00

Rethinking Modern Data Warehouse with Azure Analysis Services

2018-11-07T10:27:38+00:00

Azure Analysis Services is able to consume data from a variety of sources including storages like Azure Blob Storage or Azure Data Lake Store. Here's how you lift our file-based data directly to Azure Analysis Services.

Before I got more familiar with Microsoft Azure and all its PaaS components such as Azure Analysis Services, I was routinely sticking to Microsoft’s on-premises BI st

Rethinking Modern Data Warehouse with Azure Analysis Services 2018-11-07T10:27:38+00:00
Mehr Beiträge laden