Du bist nicht mit dem Internet verbunden.
Corporate logo
Wissen 122385

Black Friday: Wie ein riskantes Experiment den Tag gerettet hat

Am vergangenen Freitag hat bei Digitec Galaxus AG schweizweit der Ausnahmezustand geherrscht. Die grösste Sorge: Halten die Server dem Ansturm stand. An vorderster Front dabei ist Software Engineer Enes Poyraz. Er erzählt von einem Tag, an dem die Engineers alles auf eine Karte gesetzt haben.

17 Sekunden. So lange dauert es, bis digitec.ch am vergangenen Freitag, international als Black Friday bekannt, zum ersten Mal offline geht. Der Grund: Zu viele User Requests. Die Server unseres Unternehmens sind nach 17 Sekunden unter der Last von dir und anderen Kunden zusammengebrochen. Denn zu viele wollten die Sonderangebote am internationalen Ausverkaufstag abstauben.

«Wir dachten eigentlich, dass die Server länger stehen bleiben würden», sagt Junior Software Engineer Enes Poyraz.

Der Engineer berichtet von einem Tag, an dem er und sein Team eine Firma zur Unproduktivität gezwungen hat und an dem die Engineers deinen Deal mit einer Verzweiflungstat gerettet haben.

Black Friday ist 17 Sekunden alt, bevor unsere Server aufgeben

Enes ist in der Sekunde anwesend, als die Server zum ersten Mal in die Knie gehen. Denn eine Truppe Engineers – alle Teams sind nach James-Bond-Filmen benannt – sind jedes Jahr zum Black Friday auf Stand-By. In den neuen Offices an der Förrlibuckstrasse, zu Hause im Home Office oder irgendwo da draussen an Laptops mit mobilem Internet. Sie warten darauf, dass die Server nachgeben und mitigieren, wenn sie können.

Doch zur Mitternachtslast sind sie an ihren Grenzen. Die sonst so stolzen Engineers müssen einen harten Schlag hinnehmen. Den Männern und Frauen, denen schon eine Downtime von wenigen Sekunden zu lange ist, gelingt es erst nach gut zwei Stunden, die Server wieder online zu bringen. Doch stabil lief der Shop nicht. Immer wieder ging die Site offline, aber nur ganz kurz. Einzig ein Livestream aus dem Digital Marketing ist aktiv.

«Das ist zwar für Kunden etwas mühsam, aber engineering-seitig erwartetes Verhalten», sagt Enes. Er zuckt mit den Schultern. Klar, es sei unangenehm und die Engineers versuchen, diese Zeiten zu minimieren. Aber wenn eine Nation eine Website hämmert, dann könne das vorkommen.

Die zweite Welle

Es wird ruhig. Nach 2 Uhr nachts schlafen die Bewohnerinnen und Bewohner der Schweiz, haben ihre guten Deals abgestaubt. Später im Tage wird mir aus dem Zürcher Shop zugetragen, dass eine Person dediziert dazu eingesetzt worden ist, Smartphone-Abos abzuschliessen. Denn am vergangenen Freitag gab es 50% Rabatt auf jedes Smartphone beim Abschluss eines Abos. Die Abos können auch online erworben werden.

<strong>Aktion beendet!</strong> Nur heute: 50% Rabatt auf jedes Smartphone mit Mobilabo!
SmartphoneRabattaktion

Aktion beendet! Nur heute: 50% Rabatt auf jedes Smartphone mit Mobilabo!

Doch davon bekommt Enes nichts mit. Er geht kurz vor 3 Uhr morgens nach Hause, schläft ein paar unruhige Stunden. Neben ihm das Handy auf «laut», da er jederzeit den Anruf erhalten könne, dass er sofort wieder ins Büro kommen soll. Die Server seien down, er werde gebraucht. Doch der Anruf kommt nicht. Enes schläft. Gleich tun es ihm andere Engineers, darunter auch Teamleader Software Engineering Raphael Renaud, der tatsächlich Pikett hat. Raphaels Telefon hat morgens um 5 Uhr geklingelt. Anruf aus Wohlen mit der Frage, warum so wenige Bestellungen im System sind. Denn auch das Zentrallager in Wohlen hat Ausnahmezustand am Black Friday und läuft mit vollem Personalbestand und auf Hochtouren.

Gegen 9 Uhr ist er wieder an seinem Arbeitsplatz, beschreibt sich selbst als «ausgeschlafen». Die Server halten. Knapp.

«Die Last ist im Laufe des Morgens kontinuierlich gestiegen», sagt Enes, «und uns wurde klar, dass wenn das so weitergeht, dann halten wir den Tag nicht durch.»

Das käme gar nicht in Frage. Da jetzt mehr Engineers in den Büros sind als das Pikett-Détachement der vergangenen Nacht, können sie sich aufteilen. Ein Team widmet sich den internen Systemen. Alles, was abgeschaltet werden kann, wird abgeschaltet. Ein Mail von Chief Information Officer Oliver Herren informiert die digitec-Mitarbeiter um 9:36 Uhr, dass interne Tools wie die Zeiterfassung für Mitarbeiter oder einige Funktionen im Shop-Backend abgeschaltet werden, um Server-Ressourcen zu schonen. Alles, das wir lokal hosten und abschalten können, wird abgeschaltet.

In den Büros am Zürcher Hauptsitz schlucken Mitarbeiter leer. Wir sind ein Online Shop. Unsere Website ist unser Kapital, der Ort, der unsere Rechnungen zahlt und dir deine neuesten Geräte bringt. Wir machen uns Sorgen. Vor allem auch darum, weil die Redaktion den Betrieb mehr oder weniger einstellen kann. Das gesamte Magazin wird von der Frontseite verbannt. Die Bilder, auf die du klickst, fressen zu viele Ressourcen.

Meine Tastatur bleibt ungenutzt. Aber ich experimentiere mit Offline-Hardware

Doch es ist alles vergebens: Um ziemlich genau 12 Uhr Mittags gibt der Server erneut auf. Nicht so schlimm, wie in der Nacht zuvor, die Site kommt und geht im Sekundentakt, aber trotzdem zu instabil für ein gutes Kauferlebnis auf der Site.

Die Engineers vergessen die Sache mit dem Mittagessen und machen sich daran, die Site wieder online zu bringen.

Ein Experiment rettet den Tag

Während Oliver und ein Team von Engineers aus allen Abteilungen des Engineerings Services offline genommen haben, war Enes mit zwei anderen Engineers damit beschäftigt, einen Plan auszuhecken. Was tun, wenn es nicht ausreicht, die internen Services offline zu nehmen?

Die drei Engineers wurden beauftragt, eine Lösung zu finden, wenn alle anderen Lösungen scheitern.

«Mehr out-of-the-box geht es nicht», sagt Enes. Er ist schon etwas stolz darauf, zum Team gehört zu haben, das den Tag gerettet hat. Der sonst eher ruhige Mann spricht auf einmal etwas lauter.

Die Lösung heisst Redis, ein Cache-System, das die Engineers im Augenwinkel beobachten. Enes gehört zu denen, die Anwendungen darauf getestet haben. Ein Cache ist nichts anderes als ein Datenspeicher, der oft gemachte Requests abspeichert und so schneller abwickeln kann. Ein Beispiel: Wenn du auf die Black Mobile Site willst und tausende andere das auch wollen, dann muss nicht mehr jedes Mal die Datenbank hinter der Website angefragt werden. Das Cache hat eine Version der Site bereits zwischengespeichert und zeigt dir diese an. So können Ressourcen auf den weiteren Einkaufsprozess verwendet werden.

«Klar, wir haben eine Cache-Lösung, die im normalen Alltag sauber läuft», sagt Enes. Aber jedes mal, wenn ein Server down geht, müssen die Caches neu berechnet werden. Noch schlimmer: Jeder unserer Server berechnet das Cache lokal. Sprich, jedes mal wenn ein Server down geht, muss das Cache lokal auf der Server-Maschine neu berechnet werden. Das frisst Ressourcen, die eigentlich kundenseitig gebraucht werden. An Leser des Magazins denkt firmenweit keiner mehr. Die Marketing-Abteilung hat schon lange die Waffen gestreckt. Das Produktmanagement fragt sich, ob ihre Lagerbestände ausreichen. Die Shop-Mitarbeiter sehen sich mit langen Schlangen konfrontiert. Die Engineers aber sehen sich einer Nation Kaufwütigen gegenüber und denken gar nicht ans aufgeben.

«Gross habe ich Redis noch nicht ausprobiert», sagt er, «aber ich habe zwei Tage damit verbracht, etwas rumgetestet.» Das sei niemals ausreichend, um dem System den grössten Online-Shop der Schweiz anzuvertrauen. Wenn Enes seine zwei Wochen alten Notizen anschaut, dann muss er grinsen.

Es hat sicher einige Anwendungsbereiche bei uns
Notizen Enes Poyraz

Die Engineers beschliessen, Redis ohne Testing an einem Demosystem live zu nehmen. Ein riskantes Unterfangen. Bevor ein Unternehmen eine Software in ein Live System eingepflegt wird sie von internen Stellen und oft auch von Externen auf Herz und Nieren getestet. Denn nur weil Software laut dem Marketing-Material des Herstellers genau nach dem klingt, was ein System braucht, heisst das noch lange nicht, dass es den versprochenen Mehrwert bringt. Manchmal wird durch den Einsatz alles nur noch schlimmer.

«Was meinst du, kommt das gut», wird Enes gefragt.

Der Engineer nickt.

Redis übernimmt

Ab da geht alles schnell. Da Redis laut Angaben Enes «verdammt schnell und einfach» ist, steht der Server nach 20 Minuten bereit. Wo das alte Cache System digitecs auf jedem Server lokal läuft, ist Redis zentral auf einem Server und rechnet auch Requests auf anderen Server mit. Sprich: Jeder Server schreibt ins Redis-Cache und so ist die Lösung besser skalierbar und die lesenden Server haben weniger Last.

«Damit wir aber nicht eine komplett waghalsige #yolo-Aktion starten, haben wir noch ein SwitchBit eingerichtet», meint Enes. Dazu hat sich ein kleines Team der IT Operations dazu bereit erklären müssen, die Server stets zu überwachen, damit der Shop nicht komplett abgeschossen wird. Denn IT Ops ist schon den ganzen Tag mit Server-Performance-Überwachung beschäftigt. Sie sind laut Enes diejenigen, die seinem Team den Rücken freigehalten hat für das Experiment mit Redis.

Das Problem kommt mit dem Go-Live, das so unkoordiniert wie nur möglich abläuft. Auf einem Managed Server Microsofts, damit die Last intern nicht zu gross wird, will Enes Redis starten.

«Blöderweise läuft Redis auf Port 6380, der bei uns geschlossen ist», sagt er. Er beantragt notfallmässig die Öffnung des Ports, was aber nicht möglich ist, denn just dieser Port wird von Microsofts Server blockiert. Doch Enes hat eines gelernt: Er hat immer einen zweiten Plan in petto.

«Parallel habe ich versucht, Redis auf Googles Cloud zum Laufen zu bringen», sagt er. Doch auch das wird schwieriger, als angenommen. Mit Hilfe von Senior Software Engineer Michal Nebes schafft er es, einen Redis Cluster hochzufahren.

Um 16 Uhr gilt es ernst. Ein kurzes Code Review. Der Code passt laut Senior Software Engineer Boško Stupar und er misst den Roundtrip der Daten, also die Zeit, die Daten brauchen, um an den Server gesendet zu werden und wieder zum Computer des Users zurückkommen.

  • Normal: 50 Millisekunden bis 500 Millisekunden. Zu langsam
  • Redis, lokales Testsystem: 8 bis 9 Millisekunden
  • Redis, produktiv: 16 bis 19 Millisekunden

Redis geht online. Der Abendverkauf wird in die Hände eines unerprobten Systems mit minimaler Absicherung gelegt.

Bange Sekunden.

Redis liest Requests mit, baut ein Cache auf.

Die Last auf den Servern geht merklich zurück. Der Shop stabilisiert sich.

Die CPU Auslastung eines Shop Servers. Links die zwei Peaks, die eine Auslastung von 100% in der Nacht und gegen Mittag anzeigen

Die Engineers atmen auf.

Auf Facebook schreibt Boško Stupar später:

Black Friday überlebt. Das war der grossartigste Tag meiner Karriere! So stressig, so hart, so lohnend. Für Nerds: Wir haben ein Two-Stage-Caching mit einer zentralisierten Redis-Farm implementiert. Operation am offenen Herzen ohne Schmerzmittel. PS: Ich hasse Black Friday.
Boško Stupar

Die Engineers treffen sich nach Sonnenuntergang zum Bier im fünften Stock an der Pfingstweidstrasse, ein Auge immer auf den Shop. Ausgelassene Party ist anders, aber sie entspannen sich.

Um 18:55 Uhr gibt Enes entwarnung via WhatsApp:

«Redis ist live»

Die Server laufen normal, unter normaler Last. Derweil stehen die Leute im Shop an, machen Smartphone-Abos und holen Bestellungen ab. Am Shop-Eingang in Zürich steht Store Manager Adrian Maier und gibt Auskunft über Wartezeiten. Zwanzig Minuten, vierzig Minuten. Er ist müde, genau wie die Crew hinter den Kassen.

Die Engineers haben so halb Feierabend, aber die Shop-Mitarbeiter sind die letzten, die durchhalten müssen. Denn um 20 Uhr ist der Tag auch an den Kassen vorbei. Keine Abos mehr, keine Lieferungen, keine Fragen.

Quo vadis, Redis?

Das Redis-System bleibt über das Wochenende bis Montagabend am Netz, damit es Cyber Monday mitmachen kann. Die Engineers sind stolz, der Shop steht am Montag stabil. Doch dann hat Redis erstmal seinen Dienst getan und der Cluster wird wieder vom Netz genommen.

«Denn wenn alles gesagt und getan ist, dann sprechen wir hier immer noch von einem weitgehend unerprobten System», sagt Enes.

Die Engineers haben eine lange Liste von Fragen, die sie beantworten müssen, bevor sie Redis guten Gewissens dauerhaft ans Netz nehmen werden. Darunter viele Fragen, die etwa so klingen: «Warum macht Redis $ding?»

Jetzt, da sich die Lage wieder beruhigt hat, können die Engineers sich diesen Fragen widmen. Denn wenn ihnen Black Friday eines gezeigt hat, dann dass Redis Potential hat. Das nicht zu nutzen wäre schade.

User
Journalist. Autor. Hacker. Ich bin Geschichtenerzähler und suche Grenzen, Geheimnisse und Tabus. Ich dokumentiere die Welt, schwarz auf weiss. Nicht, weil ich kann, sondern weil ich nicht anders kann.

122 Kommentare

Bitte melde dich an.

Du musst angemeldet sein, um einen neuen Kommentar zu erfassen.


User dominicwue

Sehr interessante Bericht :)

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User alfagoldenglob

Super dann ist ja der Umsatz dieses Jahr gerettet

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User marco.luedi

Ganz Interessant! Danke für den Blick hinter die Kulissen und danke an die Engineers! Ihr habt echt super Arbeit geleistet am Freitag!

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Perstin

Herr Bärlocher, ich gratuliere! Endlich wieder ein Artikel von Ihnen, den ich mit Begeisterung lesen kann. Den ich generell lesen kann, ohne eine Ihrer tiefen Abneigungen gegen Hersteller X in Form von Bashing zu verspüren. Ohne eine Abneigung gegen Ihren Schreibstil zu verspüren.

Weiter so!

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Herzig, wie sich hier teilweise "Armchair Developers" mit ihrem Keyword-Bingo profilieren möchten.

Ich finde solche Berichte aus der Praxis sehr spannend. Verbessern kann man sich immer, ich glaube das weiss jeder ITler. Aber so einen "Incident" der Öffentlichkeit zu präsentieren zeugt von einer gesunden Portion Mut und Offenheit.

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User maxmustang

Und genau Freitagabend hat das System damit begonnen, im Einkaufskorb den regulären Preis zu nehmen, bei mehreren Produkten. Cache Systeme sind heikel, da sie Zustände zwischenspeichern ('noch 23 von 100') während die Datenbank effektiv bei 0 war und im Einkaufskorb der alte Preis kam.

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

genau das hab ich auch erlebt!

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User maxmustang

Nachtrag für euch Entwickler: Trotz Browser Cache löschen der Stand blieb bei 23 von 400, sogar um 0030 Uhr Samstag (black friday ja fertig) gab der cache noch '4 von 400' an obwohl schon eine Stunde vorher ausverkauft war, also lokaler browser cache kann ausgeschlossen werden. Aeh, ja hoffe ihr geht dem wirklich nach für die Kunden die deshalb zuviel zahlen.

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User beginner99

It's not a bug it's a feature. Zumindest für digitecs Kontostand.

There are two hard things in computer science: cache invalidation and naming things.

Das sind genau die Sachen, die dann schief gehen, wenn man im Produktivsystem Experimente macht. Wäre jetzt noch gut zu wissen, ob all die Leute die jetzt zu teuer bestellt haben den Aktionspreis bekommen oder mindestens die Bestellung stornieren können.

06.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User maxmustang

Digitec hat super reagiert und auf meine Anfrage hin meine zu teuren Artikel sehr freundlich und unkompliziert auch zum Aktionspreis gegeben. Technisch hat dieses redmi auch Transaktionen, es ist jedoch zu befürchten dass diese mangels Zeit nicht im Einkaufskorb vercoded wurden(und müsste wohl an vielen orten) , sodass sich das redmi mit den Transaktionen/ bestehenden Lockingmechanismus gebissen hat - cache über mehrere Personen und locking/saubere Transaktionen - schwieriges Unterfangen.

06.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User Saitek1992

Dieser Bericht ist auch interessant für Leute die nicht wissen, was eigentlich hinter der Kulisse in der IT alles los ist. Ich bin selbst System Engineer und durfte ständig Schmunzeln ;)

Danke für die gute Arbeit -> Wenn das gehen würde können sich die Engineers von meinem konto ein Bier gönnen ;)

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User thomaskall

Für einen schweizer Onlineshop nicht schlecht. Aber normalerweise macht man doch die Lasttests vorher... :)

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User A_B_C_D

Solche "Last-Tests" kommen einer DDOS Attacke gleich. Das hält kein Server durch ;-) Sieht man ja 17 Sekunden. Mehr braucht es nicht um einen Server in die Knie zu zwingen :-P

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User rpf13

Cooler Artikel, aaaaber: SEHR SCHLECHTE VORBEREITUNG! Nachdem letztes Jahr die Hölle los war dieses Jahr wieder? Ihr hattet genug Zeit euch vorzubereiten....und es gibt diverse Firmen und Onlineshops, die beweisen, dass es auch anders geht und man auch mit vieeel mehr Last locker zurecht kommen kann

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User fabiomota

Vorzubereiten in wie fern? Glaub mir, die waren sehr wohl vorbereitet. Ja, man könnte einige tausend Franken ausgeben um die Ressourcen zu erweitern und mehr Leistung zu haben .... und dann stehen diese Systeme übers ganze Jahr ungebraucht da. Verschwendung puur.

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Und trotzdem konnte ich über eine Stunde nicht auf die Seite zugreifen und habe somit mein Schnäppchen einfach schlichtweg verpasst. Und wenn man schon letztes Jahr einen solchen Ansturm hatte, dann hätte man es dieses Jahr besser machen können. Ich gebe Rpf13 recht.

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User rpf13

Rechenpower, Loadbalancer, Ressourcen kann man in einem modernen Umfeld dynamisch erweitern, eben damit die Kapazität nicht das ganze Jahr verschwendet wird. Andere Firmen schaffen es auch locker damit umzugehen und die haben noch viel mehr Traffic und Anfragen auf ihre Page. Somit zählt diese Ausrede definitiv nicht, vor allem nicht da es letztes Jahr ja schon mal passiert ist....

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Envaya

ich weiss ja nicht warum alle hier von Erfolg reden..ich kam praktisch den ganzen Tag nicht auf die Seite but oh well

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User ChrisBlaser

Es ist erlich gesagt eher trageisch den Artikel so hinzu Stellen, als ob die IT digitec den BlackFriday rettete. Ganz ehrlich, wärend Brack oder andere ganz klar das im Griff hatten, war bei euch erreut alles unten. Einmal gehts, ein zweitesmal und ein Jahr Zeit ist nicht akzeptabel aus meiner Sicht. und da ich selber solche Peaks geplant, vorbeireitet und mit Stresstests der IT Spezialisten verbracht hab, weiss ich dass das hier ein 100% versagen der IT war.
Hoffen wir mal nextes Jahr nicht.

03.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User sonyc78

Ich verstehe zwar nur einen Bruchteil der IT-spezifischen Erklärungen aber es scheint doch ein ziemlicher Hoselupf gewesen zu sein... Schon verrückt was im Hintergrund so abgeht!

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Also wenn ich das richtig verstehe laufen interne Tools auf den produktiven Shop Servern und es wurde zuvor auf caching verzichtet. Why!?
Zudem muss ich sagen für einen individual entwickelten Shop performt er wirklich nicht sehr gut. Vermutlich eine monolithische Architektur.

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User felixhofer

Nein, da hast du weder richtig verstanden noch richtig gelesen...

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Also laufen die internen Tools auf dedizierten Serven und Netzwerken? Und ein caching (nebst dem lokalen Application Cache) wird eingesetzt? Ich kenne nur die Infos aus dem Artikel und da steht was anderes. Man muss mit Feedback auf Basis der im Artikel vorhandenen Infos rechnen.

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User felixhofer

Also bezüglich internen Tools habe ich dich falsch verstanden. Dachte du meintest das "ungetestete Redis". Weiss jetzt, was du meinst. Darüber sagt der Artikel nicht wirklich etwas aus. Fakt ist, dass sowohl Shop als auch interne Verwaltung auf die selben/ähnlichen Daten(banken) zugreifen muss. Mehr kann ich dazu nicht sagen. Du meinst wahrscheinlich erwähnte Stundenerfassung o. Ä. Keine Ahnung... Fragst du Support... ;)
Heutzutage wird eh alles virtualisiert, kann also alles irgendwo laufen... Wer weiss...

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User hedwig1936

Also das die internen Tools auf produktiven Shop-Systemen laufen habe ich auch so verstanden, was meiner meinung nach schon fast fahrlässig ist, mal abgesehen von der nicht vorhandenen Skalierungsmöglichkeiten...

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User hedwig1936

@Felixhofer "Fakt ist, dass sowohl Shop als auch interne Verwaltung auf die selben/ähnlichen Daten(banken) zugreifen muss" Ich glaube kaum dass ein Zeiterfassungstool auf die Shopdatenbank zugreifen muss...

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User Anonymous

Ich denke euch fehlen 3 Dinge: Message queue middleware für Verarbeitungswarteschlangen, resiliente Microservices die vertikal skalieren und anständige Loadbalancer bzw. reverse proxies. Dann seid ihr fürs die nächste Aktionsschlacht gewappnet 🖖

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User timcbaoth

Es geht, glaube ich, sicher in diese Richtung. Es wird aber sicher eine gewisse Zeit dauern, die aktuelle Architektur an dieses Ziel zu bringen. Hier gibt es einen kleinen Einblick in die aktuellen Entwicklungen: digitec.ch/de/page/wie-sich...

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Spannender Artikel, danke für den Link. Dass viel Innovation in einem Shop möglich ist, zeigt Digitec ganz klar. Daher ist Digitec auch einer der führenden Online Shops.

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User Anonymous

You should look for a real tech team. I mean it, really. It's just... embarassing. The graphs you paste, the "experiments"... architecture of your system, where shop db is used for employee time tracking... A skilled junior developer or architect would tell you that you need to improve competences!

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User KarmaEDV

Not macht erfinderisch. Schöner Blick hinter die Kulissen. Ich als Dev nehme mir das zum Vorbild. 👍

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Und jetzt stellt euch mal vor, was am Black Friday bei Amazon los war...

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

I would not say so, knowing how their team works, they just prepare instead of "hope".

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User KarmaEDV

Ach im notfall kann amazon auf die Cloud setzen...

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

..welche sie selbst betreiben.. :-)

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Bringt mich irgendwie darauf, wann digitec die ersten Cloud Services wohl anbietet? Rent a Digitec VM? :-)

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User andyforpresident

AWS ist genau aus dem Black Friday Problem enstanden! Weshalb ich nicht verstehe, wieso digitec.ch nicht von den grossen abgeschaut hat, all die Public Clouds bietet sich doch genau für so ein Webservice an.

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User STIMO1989

Sind das nicht SYSTEM Engineers?

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User boskicthebrain

Es waren einige Leute involviert: Entwickler, ItOps, SRE, Architekten aber das Core-Team waren 3+ Leute die auf die Job-Titel an dem Tag nicht geschaut haben, sondern einfach gemacht ;)

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User KevRWL

Oder man mietet Server die mit dem Cloud System arbeiten und stellt dies vorgängig ein für den Black Friday. Klar kostet Geld aber hey, man ist ONLINE.. :)

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User MrDraxs

Eure Schreibweise erstaunt mich immer und immer wieder! Ihr schafft es aus einem "langweiligen" IT-Problem, einen unglaublich kurzen Krimi zu machen. @Dominik Bärlocher unglaublich gut geschrieben! Hat wirklich spass gemacht zu lesen... mehr davon! Thumbsup!

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User mathowohlen

Liebe Engineers.
Herzliche Gratulation zur Rettung letzten Freitag.
Ein sehr interessanter und amüsanter Artikel, habe teilweise Gänsehaut während dem Lesen.
Danke für den Blick hinter die Kulissen und ein "Big Up" an Enes Junior :-).
Ihr habt echt super Arbeit geleistet!

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User loicschneider

Cool Aber......Wieso eigentlich immer diese "Engineers"? Ingenieure heisst dass auf deutsch oder IT Spezialisten, wäre da treffender und definitiv weniger nervend. Nur weil es auf englisch ist macht es den Bericht nicht besser nur mehr "Hipster"

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User kafkef5050

sehr interessant, gibt es eigentlich auch eine zahl der verkauften smartphones am 24.11. ?

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Platinum22

Und ich habs verpasst :(
Hatte mich zu stark auf die Sonderseite mit den Deals fokussiert, aber da waren die Deals doch eher schwach...

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

das würde mich auch Wundern nehmen in Anbetracht dessen dass Digitec meint es könne bis zu drei Wochen dauern bis ich mein neues Smartphone überhaupt abholen kann... :) hat irgendjemand überhaupt bis jetzt sein neues Gerät schon gekriegt?

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User donutmaker

Mir wurde am Telefon gesagt, dass mehr als 8000 Handy-Verträge abgschlossen wurden.!

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

whoa, das ist ja echt beeindruckend!! Hut ab Digitec!

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User Anonymous

Peut-on avoir cet article en français s'il-vous-plaît ?
Merci !

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anne Chapuis

Bonjour,
Merci pour votre commenaire. Nous allonsnous occuper de la traduction du texte :)

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anne Chapuis

Voilà, l'article est traduit. :) Bonne lecture

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Au top, merci !

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Merci pour la traduction, c'est un peu écris dans un style "descriptif" mais le contenu est intéressant.En tant que Suisse-romand j'apprécie vos efforts de traduction et l'esprit Digitec qui colle bien aux produit high-tech que vous vendez.

02.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User gautierboder

Merci, ich habe am Freitag auf Twitter nach ein solchem Artikel gefragt. Hier ist es und sogar interessant. Ich werde es weiter leiten. A schöne Tag an alle. Gruss aus ein software architect der solchem hype launches lebt jedem Jahr ;)

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User YvesMundorff

Sehr Hands-On. Engineering wäre: Szenarien vorher mit einem L&P Test durchzuspielen und ev. schon eine Redis-Cloud für den Notfall aufbauen. Das war wohl das Glück des Tüchtigen. ;-)

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User simonk.ch

Wäre ich Engineer bei Digitec würde ich mich dafür schämen, wenn ich einer zu erwartenden Lastspitze mit "ich hoffe die Server schaffen das" begegnet wäre. Als Incident Management wäre es ein guter Job gewesen.

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

Antworten
User fbausk

Schade das es hier nur um Engineer und ein wenig um die Shop Mitarbeiter geht. Ich könnte mir vorstellen das es grade in der Logistik viel los war und dies wird weder bei Digitec noch bei Galaxus erwähnt.

30.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User querdenker

Noch ein paar Anreize:
- "Activ Actic" DB Cluster auf lokalen NVMe SSDs (kein SAN)
- Ansible und Docker zur dynamischen Installation
- Kubernetes und Prometheus zur Überwachung/Monitoring
- Mehr statischer Content und Caching Server wie Nginx oder Varnish
- Linux/FreeBSD

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User Anonymous

Leider ist auf dem Request-Count-Diagramm nicht ersichtlich, wie viele rpm es überhaupt waren. Könnt ihr das noch nachliefern oder ist das ein Geschäftsgeheimnis?

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User tobi.schoergi

Besti Artikel woni han dörfe lese vo eu!
Mängisch isch es ide IT so das mer eifach Muet zeige muss und was wage. Gratz Digitec das es klappt het ^^

29.11.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.

User mjuon01

Nun, es gäbe renommierte Cloud Anbieter in der Schweiz, welche Euch volle Elastizität der Serverresourcen (stichwort CloudFoundry) garantieren würden und bezahlen müsste Digitec bloss den tatsächlichen CPU und RAM Verbrauch, und dies minutengenau.
Aber eben wäre ist ja schon fast ein Outsourcing und das ist ja per se "böse"

01.12.2017
Missbrauch melden

Du musst dich anmelden um einen Missbrauch zu melden.