BTW 2013.de
by Michelle Böhm
refreshed
Große Daten (big data) für Datenbanksysteme

Datenbanksysteme für Business, Technologien und Web

Im digitalen Zeitalter basiert alles auf Daten. Die Flut an Dateneingaben, Ausgaben, an Analysen und Auswertungen wäre mit Datenbanksystemen nicht denkbar. Ihren Einsatz finden die Datenbanksysteme nicht nur im Controlling und Rechnungswesen sondern auch in Warenwirtschaftssystemen, Enterprise Resource Planning, bei Content Management Systemen oder im Customer Relationsship Management.

Was ist ein Datenbanksystem?

Große Daten (big data) für Datenbanksysteme
Bei einem Datenbanksystem handelt es sichum eine logische Einheit von zusammengehörenden Daten mit ihren Meta-Beschreibungen sowie mit weiteren zusätzlichen Informationen. Diese Informationen werden zur Verarbeitung und zur Bereitstellung der Daten benötigt. Datenbanksysteme findet man in den unterschiedlichsten Datenbanktypen. Die Mehrzahl wird in HTML erstellt jedoch findet man heute auch Datenbanken in XML. Die Hauptaufgabe eines jeden Datenbanksystems besteht darin, die großen Mengen an Daten effizient, wiederspruchsfrei und dauerhaft zu speichern. Das Datenbanksystem soll jedoch auch Teilmengen aus diesen Daten in unterschiedlichen und bedarfsgerechten Darstellungsformen dem jeweiligen Nutzer oder im jeweiligen Anwendungsprogramm bereitstellen.

Aufbau

Ein Datenbanksystem besteht aus zwei Teilen. Hierzu gehört die Datenbank als Datenbasis sowie das Datenbankmanagementsystem. Die Datenbank hat die Aufgabe, die Informationen strukturiert zu speichern und die flut an Informationen zu verwalten. Die Datenbank muss hierbei eine einheitliche und anwendungsneutrale Sicht auf die Daten ermöglichen. Das Datenbankmanagementsystem dagegen ist die Verwaltungssoftware. Es hat die Aufgabe, die interne und strukturierte Speicherung der Daten zu organisieren. Das Datenbankmanagementsystem kontrolliert jedoch auch alle Zugriffe auf die Datenbank unter Beachtung aller lesenden und aller schreibenden Zugriffe. Sie haben sich als fester Bestandteil der unterschiedlichsten IT-Landschaften etabliert.

Anforderungen und Merkmale

Merkmale für Datenbanksysteme
An ein Datenbanksystem werden komplexe und vielseitige Anforderungen gestellt. So müssen sie unter anderem eine konsistente und einheitliche Datenhaltung erfüllen. Zu den Anforderungen gehören jedoch auch eine Datenunabhängigkeit, ein effizienter Speicherzugriff, die Möglichkeit der parallelen Datenzugriffe, eine gemeinsame Datenbasis, eine hohe Datensicherheit, eine hohe Datenintegrität wie auch die Möglichkeit eines Wiederherstellungsverfahrens eine Abfragesprache und keine oder eine kontrollierte Redundanz. Zu diesem Zweck muss das Datenbanksystem eine Reihe von wichtigen Merkmalen aufweisen.

Native und relationale Datenbanken

Datenbanken werden in native und relationale Datenbanken unterschieden. In nativen Datenbanken werden die Dokumente direkt als Dokument abgespeichert. In relationalen Datenbanken dagegen werden die Inhalte in einem eigenen Datentyp abgespeichert. Dies Art der Datenbanken hat sich in den letzten Jahren zum Standard entwickelt. Die relationalen Datenbanksysteme gehören heute zu den am weitesten verbreiteten Datenbanken in der ganzen Welt.

Datenbanksysteme

Datenbanksysteme und ihre Verwendung

Mittlerweile sind Datenbanksysteme ein fester Bestandteil IT Landschaften geworden. Überall wo Software Applikationen einen Zugriff auf eine gemeinsame und integrierte Datenbasis durchführen, spielen Datenbanken eine essentielle Rolle. Welches Datenbanksystem konkret zum Einsatz kommt, hängt von einer Reihe von einzelnen Faktoren ab. Neben Performance müssen auch Kompatibilität, sowie eine nahtlose Implementierung bei der Wahl eines Datenbanksystems berücksichtigt werden. Traditionell wurden in der Datenverarbeitung spezielle Dateisysteme und Dateiformate für Anwendungen entwickelt. Diese konnten auch nur von entsprechenden Applikationen verarbeitet werden. Dies beeinhaltete eine enge Kopplung zwischen den Daten und dem verarbeitenden Programm. In andere Programme konnten die Daten so nur manuell und mit großem Aufwand übertragen werden.

Datenbank sorgt für mehr Flexibilität

Datenbanksysteme
Durch eine Datenbank (englisch: Database) wird die zentrale und dauerhafte Speicherung von Daten ermöglicht. Auch können die Daten auf diese Weise automatisiert verwaltet werden. Hier kann zwischen statischen und dynamischen Datenbanken unterschieden werden. Das Abfragen, sowie die Speicherung erfolgt über eine spezielle Skriptsprache. Zumeist handelt es sich um den SQL Standard oder einer herstellerspezifischen Abwandlung dieser. Dies ist allerdings nur bei einem relationalen Datenbanksystem der Fall. Daneben existieren unter anderem auch deduktive Datenbanken, objektorientierte Datenbanken, sowie Geodatenbanken. Häufig ist im Generellen von einer Datenbank als Datenverwaltung die Rede. Genauer betrachtet handelt es sich allerdings um Datenbanksysteme. Ein Datenbanksystem besteht neben einer Datenbasis auch aus einem Datenbankmanagementsystem (genannt: DBMS). Das DBMS führt Anweisungen aus, organisiert und verwaltet die Datensätze in der Datenbank. Die unterschiedlichen Arten von Datenbänken erfüllen zudem verschiedene Funktionen. Das bedeutet, dass, je nach Verwendungszweck, sich auch das Datenbanksystem unterscheidet.

Wichtige Daten speichern mit relationalen Datenbanken

In den letzten Jahren haben sich relationale Datenbanken zum Standard entwickelt, wenn es um die Speicherung wichtiger Daten geht. Sie zählen deshalb zu den weitverbreitesten Datenbanksystemen der Welt. Relationalen Datenbanken ermöglichen eine strukturierte Ablage von sensiblen Daten. Auch hat sich für diese Datenbankgattung die Modellierungssprache Entity Relationship Diagram (genannt: ERD) herausgebildet. Über die Jahre wurde diese stetig weiterentwickelt. ERD wird beispielsweise bei der grafischen Modellierung von Sachverhalten eingesetzt. Auch kommt sie bei der Modellüberführung in ein relationales Datenbankschema zum Einsatz.

Relationale Datenbanken arbeiten mit SQL

Relationale Datenbanken arbeiten mit SQL, um Anweisungen und Abfragen durchzuführen. Die verschiedenen Datenbankhersteller haben zumeist die Syntax geringfügig modifiziert, was sich zum Beispiel an der Bezeichnung der Sprache erkennen lässt (PL/SQL, T-SQL).

Viele Daten in Datenbanken speichern mit NoSQL

NoSQL ist noch eine vergleichsweise junge Technologie. Konträr zu relationalen Datenbanken geschieht hier die Ablage der Daten in einer relativ unstrukturierten Form. NoSQL Datenbanken werden dazu verwendet, um zum Beispiel Objekte einschließlich ihren Attributen zu speichern. Mit dem Big Data Hype begann sich diese Technologie zu etablieren. NoSQL Datenbanken bieten die Möglichkeit, große Datenmengen schnell auszuwerten und zu speichern. Auf die Aktualität und Konsistenz der Daten wird bei diesem Modell weniger Wert gelegt. Die Hauptaufgabe ist darin definiert, große Datenmengen und hochfrequente Daten schnell zu verarbeiten.

Vergleich von NoSQL und relationalen Datenbanken

Im Vergleich avancierten relationale Datenbanke zum Standard. Dies lag insbesondere an Speicherknappheit, sowie den hohen Kosten für Speichermedien in der Vergangenheit. Dadurch, dass die Speicher immer effizienter werden, ist Speicherknappheit kein wirkliches Problem mehr. Speicher ist mittlerweile überall günstig zu erwerben. Für die schnelle Speicherung von großen Datenmengen sind relationale Datenbanken jedoch nicht geeignet. Die Normalisierung und Integritätsprüfungen nehmen hier zu viel Verarbeitungszeit in Anspruch. Zu diesem Zweck sind schnelle NoSQL Lösungen wesentlich besser geeignet. Dennoch gehören relationale Datenbanksysteme nicht generell der Vergangenheit an. Diese sind immer dort notwendig, wo es auf Integrität, Genauigkeit, Nachvollziehbarkeit, sowie Aktualität von Datensätzen ankommt. Dies ist beispielsweise bei Transaktionssystemen der Fall.

Vorteile von Datenbanken

Durch den Einsatz von Datenbanksystemen werden Redundanzen verhindert (Mehrfach Speicherung identischer Informationen). Auch Inkonsistenzen, wie zum Beispiel Aktualisierungsprobleme bei Datensätzen, wird auf diese Weise verhindert. Darüber hinaus wird die Abhängigkeit zwischen Programm und Daten aufgelöst, da alle Anwendungen auf eine zentrale Datenbasis zurückgreifen.