Chat-GPT-Studie

Worum es geht:

Wir analysieren über 1500 vergleichbare Unternehmen (gleiche Branche, auf Deutschland verteilt) und prüfen, welche Websites ChatGPT „kennt“ bzw. in Antworten erwähnt. Dazu werden Schema.org-Markups und technische SEO-Faktoren wie Mobile-Optimierung, robots.txt, Überschriftenstruktur und Ladezeit verglichen.

Zentrale Ergebnisse

Websites mit FAQPage-Schema waren deutlich häufiger ChatGPT-sichtbar; im Regressionsmodell war das der stärkste positive Faktor mit etwa 13-fach höheren Odds. Auch Product-Schema, Mobile-Freundlichkeit, robots.txt sowie die Nutzung von h2- und h3-Überschriften zeigten positive Zusammenhänge. Die Seiten der sichtbaren Agenturen luden im Schnitt schneller.

Einordnung

Die Studie findet Korrelationen (keine gesicherte Kausalität) zwischen verschiedenen Attributen und der Sichtbarkeit. Trotzdem sprechen die Ergebnisse dafür, dass strukturierte Daten und saubere technische Website-Strukturen helfen können, von KI-Systemen besser verstanden und eher referenziert zu werden.

Praktische Bedeutung

Für Unternehmen heißt das: FAQ-Seiten, strukturierte Produkt- oder Leistungsangaben und saubere technische SEO-Basics könnten nicht nur für Google, sondern auch für KI-Assistenten wichtig sein. Der Artikel ordnet das als Teil von „Generative Engine Optimization“ ein, also einer Optimierung für generative Such- und Antwortsysteme.

Kurzfassung in einem Satz

Der Artikel zeigt, dass strukturierte JSON-LD-Metadaten, vor allem FAQPage und Product, zusammen mit guter technischer SEO die Wahrscheinlichkeit erhöhen, dass ChatGPT eine Website erkennt und erwähnt.

Ergebnisse im Detail

Die Grafik zeigt die geschätzten Log-Odds-Ratios aus einer logistischen Regression; Werte rechts von 0 sprechen für einen positiven Zusammenhang mit der Zielvariable, Werte links von 0 für einen negativen Zusammenhang. Die horizontale Linie je Punkt ist das Konfidenzintervall; wenn sie die Nulllinie schneidet, ist der Effekt statistisch unsicher.

Wichtigste Interpretation

  • FAQPage Schema vorhanden hat den stärksten positiven Effekt und liegt deutlich über 0. Das heißt: Seiten mit FAQ-Markup sind in diesem Modell viel wahrscheinlicher mit der Zielvariable verbunden.
  • Mobile Optimierung vorhanden und Product Schema vorhanden zeigen ebenfalls klar positive Effekte.
  • robots.txt vorhandenh2 vorhanden und h3 vorhanden liegen ebenfalls im positiven Bereich, aber schwächer als FAQPage.
  • ai.txt vorhanden ist nur leicht positiv und vermutlich eher ein kleiner Effekt.

Kaum relevante oder neutrale Variablen

  • h1 AnzahlLadezeit (ms)Anzahl interner Links und Bilder ohne Alt-Text liegen nahe bei 0. Das bedeutet: In diesem Modell zeigen sie keinen klaren Zusammenhang mit der Zielvariable.
  • Ihre Konfidenzintervalle sind eng um 0 oder schneiden die Nulllinie, daher sind diese Effekte vermutlich nicht robust.

Negative Zusammenhänge

  • Sitemap vorhanden zeigt einen negativen Koeffizienten. Das würde bedeuten, dass eine Sitemap hier mit geringerer Wahrscheinlichkeit der Zielvariable zusammenhängt. Vermutlich ist dies jedoch eher eine Anomalie die man bei einer Vielzahl von Attributen erwarten würde.

Wie man die Größenordnung liest

Ein Log-Odds-Ratio von etwa 1 bedeutet nicht „1 Prozentpunkt mehr“, sondern einen Anstieg der Log-Odds. Zur groben Übersetzung in Odds nimmt man eβeβ:

  • β=1β=1 entspricht ungefähr einer Verdreifachung der Odds.
  • β=2β=2 entspricht ungefähr dem Siebenfachen.
  • β<0β<0 senkt die Odds entsprechend.

Fazit in einem Satz

Die Grafik spricht dafür, dass vor allem FAQPageMobile Optimierung und Product Schema die stärksten positiven Prädiktoren sind, während viele andere technische SEO-Faktoren nur schwache oder keine klaren Effekte zeigen.