Einführung

VoiceBase mit Sitz in San Francisco, Kalifornien, bietet Sprach-zu-Text für Audio- und Video-Transkriptionen sowie Werkzeuge für Wissensextraktion, Sprachanalyse und prädiktive Analyse zur Analyse gesprochener Informationen. Seine Kunden nutzen diese Tools, um Agenten zu überwachen, Kundenanfragen zu analysieren, Vertriebsmitarbeiter zu coachen, Upsell-Möglichkeiten in Call Centern zu identifizieren und viele weitere Anwendungen.

Herausforderung: Verteilung von 50 GB auf 400 Server in regelmäßigen Abständen

Der anspruchsvollste Aspekt der Transkription ist die Genauigkeit. Die Sprachmodelle von VoiceBase müssen so geschult werden, dass sie Akzente erkennen, benutzerdefinierte Vokabulare für Berufe wie Medizin und Recht enthalten und mit mehreren Sprachen umgehen. Am Anfang waren die Sprachmodelldateien etwa 500 MB groß, aber mit der ständig verbesserten Software sind sie heute näher an je 10 GB.

Für seine Sprachtools nutzt VoiceBase Bareboneserver, die über mehrere Standorte verteilt sind. Jede Kollokation enthält ein paar Racks, die einen Switch, einen Router und so viel Hardware wie möglich aufnehmen. Da diese für reine Rechenleistung verwendet werden, gibt es keine Redundanz, außer dass jedes Rack über einen anderen ISP verbunden ist.

Wenn Sprachmodelle an die Sprachserver verteilt werden müssen, müssen so schnell wie möglich satte 50 GB an Dateien an über 400 Produktionsserver verteilt werden. Der Hauptengpass lag im Rechenzentrum selbst, wo 1 GB Kabel jedes Rack versorgen.

Mit der Veröffentlichung neuer Sprachmodelle alle zwei bis vier Wochen wurde der Verteilungstag früher vom VoiceBase DevOps-Team gefürchtet. Der Verbreitungsprozess würde etwa acht Stunden dauern. Im Rechenzentrum führte das Team eine Kombination aus selbst erstellten Skripten aus, die auf Open-Source-Tools wie rsync und NFS basieren. Die Distribution würde sich routinemäßig aufgrund von abgelaufenen Passwörtern, geänderten Pfaden, Engpässen beim Herunterladen von den Servern und den meisten Problemen bei der Verteilung von einem Dateiserver auf 30-40 Computer innerhalb eines Racks verzetteln.

Lösung: Peer-to-Peer-Dateiverteilung

Christian Bryndum, Director of Operations bei VoiceBase, wusste, dass er zu einer Peer-to-Peer (P2P)-basierten Lösung wechseln musste. Die Investition in sehr teure Router für jedes Rack würde die Verteilung über den gesamten Pfad nicht beschleunigen und jede TCP/IP-basierte Option würde zu den gleichen Straßensperren führen.

VoiceBase untersuchte mehrere P2P-Verteilungslösungen, darunter Twitters Open-Source-Mord, der auf dem BitTorrent-Protokoll basiert. Bei der Untersuchung von Murder stieß VoiceBase auf Resilio Connect, das ebenfalls auf dem sehr effizienten BitTorrent-Protokoll basiert.

VoiceBase hat Resilio Connect gründlichen Tests sowohl in der QA- als auch in der Dev-Umgebung unterzogen. Nachdem Resilio Connect die Testphase durchlaufen hatte, begann das Team mit der Implementierung in die Produktion. Da der Verbreitungsprozess viele Standorte, Racks und Server umfasst, musste jeder Schritt automatisiert werden, so dass kein Mensch in den Verteilungsprozess eingreifen musste.

Ergebnisse

Der positive Effekt des Einsatzes von Resilio Connect wurde sofort spürbar, da der neue, hochzuverlässige Verteilungsprozess nur 12 Prozent der ursprünglichen Downloadzeit in Anspruch nahm!

„Resilio Connect ermöglicht es uns, unseren Code, insbesondere neue Sprachmodelle, in kürzester Zeit zuverlässig zu verteilen. Diese Kopieraufträge dauern jetzt eine Stunde, von acht“, sagt Bryndum, „und das Beste daran: Sobald Resilio Connect installiert wurde, funktioniert es einfach: Wir müssen nie manuell in irgendeiner Weise eingreifen.“

Sie benötigen unsere Hilfe?

Kontaktieren Sie uns

In einem ersten Gespräch teilen Sie uns Ihre Wünsche und Anforderungen mit. Auf dieser Basis erarbeiten wir ein individuelles Konzept für Sie.

Support

Jetzt Anrufen

Kontakt

Kontaktieren Sie uns und starten Sie eine großartige Zusammenarbeit.