SISTRIX GmbH Logo

SISTRIX GmbH

Bonn

SERP Parser für SEO Analytics bei SISTRIX

Software Craftsman | DevOp

September 2016 - Januar 2018
1 Jahr 5 Monate
Vollzeit
Produktarbeit
Bonn

Relevanz

Warum dieser Case relevant ist

Diese Einordnung macht sichtbar, was für Hiring oder Zusammenarbeit zählt: Wirkung, Belege, Fit und AI-/Delivery-Relevanz.

Systemwirkung

SERP-Parser und Big-Data-Delivery für SEO-Analytics mit 450M+ Keywords, 200M Seeds, SERP-Feature-Auswertung, Status-Dashboard und CI/CD-Betrieb.

AI-/Delivery-Relevanz

AI-native Systemarbeit steht auf denselben Grundlagen: große Datenflüsse, reproduzierbare Pipelines, klare Ownership, automatisierte Qualitätssicherung und operativ belastbare Plattformen.

SISTRIXSERP ParserYou Build It You Run ItSEO Analytics

Proof

450M+

Keywords weltweit

200M

Seeds im Crawler

SERP Features

Parser-Produkt

Passt besonders bei

  • Für Teams mit datenintensiven SaaS-Produkten, bei denen Pipeline, Delivery und Betrieb zusammengehören.
  • Für Organisationen, die nicht nur Big-Data-Backend brauchen, sondern verlässliche Lieferung und Ownership.

Case-Kontext

Überblick

SISTRIX brauchte SEO-Analytics-Pipelines, die vom selben Team gebaut, geliefert und betrieben werden konnten. Ein zentraler Teil war der SERP Parser: Suchergebnisse über Länder und Geräte erfassen, auswerten und in einem Status-Dashboard sichtbar machen, statt nur Rohdaten durch Pipelines zu schieben.

Ich arbeitete im "You Build It, You Run It"-Modell über Jenkins/Docker-CI/CD, Spark/Hadoop-Extraktion für 450M+ Keywords weltweit und Apache-Mesos/Marathon-Plattformarbeit. Der Parser machte SERP Features wie Organics, SEM, Shopping, Knowledge Graph, Maps, Featured Snippets und Sitemaps über countries and devices operativ prüfbar.

Verantwortung

Aktivitäten

  • SERP Parser: Suchergebnisse über Länder, Geräte und SERP Features strukturiert auswertbar gemacht
  • Parser-Status: Status-Dashboard mit Play Framework für Week-basierte Läufe, Success-Status, Durchsatz und calc nodes
  • Big-Data-Pipelines: HTML-Parser mit XPath für Millionen Keywords pro Land und API-Integration
  • Datenextraktion: HTML-Crawler mit Spark/Hadoop für 200M Seeds und strukturierte Datenextraktion
  • DevOps & CI/CD: "You Build It, You Run It"-Pipeline mit Jenkins/Docker und automatisierten Deployments
  • PaaS-Architektur: Apache Mesos/Marathon, AWS Route 53 und skalierbare Infrastruktur
  • Qualitätssicherung: automatisierte Akzeptanztests für SaaS-Tools und Cucumber-Testing
  • Monitoring & Operations: Status-Dashboard mit Play Framework und operative Transparenz

Arbeitsweise

Methodik

  • "You Build It, You Run It": DevOps-Kultur und End-to-End Ownership für Parser, Pipelines und Betrieb
  • Operative Sichtbarkeit: Parser status, SERP Features, Durchsatz und Fehlerzustände als Produktfeedback nutzbar machen
  • Big-Data-Processing: Spark/Hadoop und skalierbare Datenpipelines für wiederholbare Suchergebnis-Auswertung
  • CI/CD: automatisierte Tests, Continuous Deployment und Deployment-Feedback eng am Laufzeitverhalten halten

Technischer Kontext

Technologie-Stack

Die Tools sind hier kein Selbstzweck. Relevant ist, welche Systemebenen im Projekt zusammengebracht wurden.

9Bereiche
35Technologien

Backend

7
JavaScalaPlay FrameworkAkkaRxJavaGroovyJOOQ

Frontend

2
JavaScriptHTML-Parsing

Daten & KI

11
SparkHadoopBig-Data-VerarbeitungNutchTikaXPathSAXON-HESuchergebnis-ParsingSERP ParserSERP-Feature-ExtraktionDatenextraktion

DevOps

6
DockerGitApache MesosMarathonContainer OrchestrationStatus Dashboard

CI/CD & Delivery Pipelines

2
JenkinsCI/CD Pipeline

Architektur

1
PaaS-Architektur

Datenbanken & Storage

3
MySQLArangoDBDatenspeicher

Tools

2
CucumberMockito

Methoden & Qualität

1
Automated Testing

Nächster Schritt

Wenn du ähnliche Wirkung für Hiring, Zusammenarbeit oder eine konkrete Transformation prüfen willst, ist das der richtige Einstieg.

Schreib kurz, welche Lage du gerade einordnen willst. Ich antworte persönlich und sage klar, ob mein Profil passt.