Informatiker Board (http://www.informatikerboard.de/board/index.php)
- Themengebiete (http://www.informatikerboard.de/board/board.php?boardid=1)
--- Praktische Informatik (http://www.informatikerboard.de/board/board.php?boardid=6)
---- Datenbanken (http://www.informatikerboard.de/board/board.php?boardid=19)
----- Semijoin/Bloomjoin in verteilten DB (http://www.informatikerboard.de/board/thread.php?threadid=1814)


Geschrieben von yuro123 am 12.02.2014 um 20:37:

  Semijoin/Bloomjoin in verteilten DB

Hallo,

Habe wieder mal eine Frage zur folgenden Aufgabe:

Wir wandeln unsere Datenbank etwas ab:
Mitarbeiter( MId, MName, AId, Gehalt, ...)
Abteilung( AId, MgrId, Sitz, Status, ...)
(MgrId ist die MId des Managers der Abteilung.)

Die Abfrage, die uns interessiert, lautet:
select * from Mitarbeiter M, Abteilung A
where M.MId = A.MgrId and A.Status > 50

und wir wissen, dass etwa 1 Prozent der Mitarbeiter Abteilungsleiter sind und etwa die Hälfte der Abteilungen den gewünschten Status hat.
Setzen Sie voraus, dass die Tabelle der Mitarbeiter in Frankfurt, die der Abteilungen in München gespeichert ist. Sie selbst sind in Hamburg.

1.000 Zeilen à 4 KBytes. Die Schlüssel sind jeweils 4 Bytes lang. Für die Übertragungsrate im Netz nehmen wir 100 KBytes pro Sekunde an.

-Berechnen Sie den Join mit der Strategie des Bloomjoin in Frankfurt und übermitteln Sie das Ergebnis nach Hamburg.

-Berechnen Sie den Join mit der Strategie des Semijoin in München und
übermitteln Sie das Ergebnis nach Hamburg.

die Formel lautet:

C1 Datenrate = Zahl n übertragener Bits pro Sekunde
C0 Initialisierungszeit = Dauer des Verbindungsaufbaus
Gesamtkosten C = C0 + n/C1 in Sek.

Kann mir jemand helfen?



Geschrieben von ed209 am 13.02.2014 um 23:03:

 

Was sind Bloomjoin und Semijoin?


Forensoftware: Burning Board, entwickelt von WoltLab GmbH