Powering a Data Hub at Otto Group BI with Schedoscope

In order to build data services or advanced machine learning models, organizations must integrate large amounts of information from diverse sources. As a central place to consolidate as many data sources as possible we often find what is fashionably called a data lake. Building a data lake usually starts by collecting as much data in raw form as possible. The idea is to give data scientists simple access to all available data so that they can combine information in ways not yet anticipated. Hadoop is the preferred choice for such a system because it is able to store vast amounts of data in a cost-efficient manner and is largely agnostic to structure. Weiterlesen

Catch the inovex Tram [Gewinnspiel]

Juhu, es ist soweit: Seit wenigen Tagen fährt die inovex-Tram durch Karlsruhe (Linie 1 bis 6) – und wird dies auch noch ein ganzes Jahr lang tun. Grund genug, eine neue Verlosung zu starten, bei der ihr jeden Monat ein digitales Gadget gewinnen könnt. Lest weiter und erfahrt, wie das Spiel funktioniert und welcher Preis in der dritten Runde winkt. Weiterlesen

Datenprodukte: 5 Erfolgsfaktoren machen den Unterschied

„Data-rich companies are not an economic threat, but rather are an important source of innovation.“

Sowohl in den USA als auch in Europa gibt es Überlegungen, Unternehmen stärker zu regulieren, die Daten als Grundlage ihrer Geschäftsmodelle sehen. Es gibt also offensichtlich einige Firmen, die besonders gut verstanden haben, wie man Daten monetarisieren kann. Es gibt aber auch sehr viele Firmen, die es versuchen und weniger erfolgreich sind. Daher haben wir nach den Gemeinsamkeiten erfolgreicher datenzentrischer Geschäftsmodelle gesucht und 5 zentrale Erfolgsfaktoren gefunden.
Weiterlesen

Causal Inference and Propensity Score Methods

In the field of machine learning and particularly in supervised learning, correlation is crucial to predict the target variable with the help of the feature variables. Rarely do we think about causation and the actual effect of a single feature variable or covariate on the target or response. Some even go so far as to say that „correlation trumps causation“ like in the book „Big Data: A Revolution That Will Transform How We Live, Work, and Think“ by Viktor Mayer-Schönberger and Kenneth Cukier. Following their reasoning, with Big Data there is no need to think about causation anymore, since nonparametric models will do just fine using correlation alone. For many practical use cases, this point of view may seem acceptable — but surely not for all.

Weiterlesen

Datenprodukte erklärt

Mit Daten Geld verdienen: Google, Facebook und Amazon machen es vor – aber wie mache ich es nach? Wir wollten wissen, ob und wie sich Datenprodukt-Geschäftsmodelle als Geschäftsmodelle auf der Basis von Daten von anderen digitalen und traditionellen Geschäftsmodellen unterscheiden. Dazu beantworten wir in diesem Blogartikel zunächst die Frage: Was sind Datenprodukte überhaupt? Weiterlesen

Gewinne 2 Karten für die JAX 2017! [Gewinnspiel]

Vom 8. bis 12. Mai findet in Mainz die JAX statt – und wir sind auf der Konferenz für Java, Architektur- und Software-Innovation wieder mit einem Stand und 2 Talks vertreten! Da eine Konferenz aber von ihren Gästen lebt und wir euch vor Ort treffen möchten, verlosen wir 2 3-Tages-Tickets im Wert von je 1.450 Euro. Was ihr dafür tun müsst, lest ihr in diesem Artikel. Weiterlesen

Android UI Tests mit dem Espresso Test Recorder und einem Mock Web Server

Obwohl sich das Espresso Framework schon seit längerer Zeit zum Standard für UI-Tests unter Android etabliert hat, ist die Hürde noch immer recht hoch diese auch zu implementieren. Durch den Espresso Test Recorder, der mit Android Studio 2.2 eingeführt wurde, hat sich diese Schwierigkeit deutlich verringert. Wir wollen uns also damit beschäftigen, wie wir relativ einfach UI-Tests generieren aber auch unabhängig von Remote-Servern machen können. Weiterlesen

Web Performance Optimisation (Part 2): Perceived Performance

In the previous article of this series we talked about the boundaries of Web performance optimization (WPO). We introduced some metrics and a scale of measurement but we omitted one large part of the problem due to the purely technical point of view we took previously. In reality, while time and performance can be measured objectively it is perceived subjectively by humans. Static measurement scales and performance analyses are relevant for performance measurements but largely irrelevant in real world usage. As long as users have to interact with an application we have to make sure that we test and evaluate the application’s performance from a real user’s perspective. Consequently in this part of the series we want to talk about perceived performance and why it makes sense to put the user first when it comes to WPO. Weiterlesen