Bei unserem Ziel, die Beliebtheit einer Programmiersprache abzuschätzen, haben wir erkannt, dass niemand jede Person überwachen kann, die Code schreibt, egal ob es sich um ein Kind handelt, das ein Java-Skript für einen persönlichen Minecraft-Server schreibt, um einen Entwickler mobiler Apps, der hofft, groß rauszukommen, oder ein Luft- und Raumfahrtingenieur, der geschäftskritischen Code für eine Reise zum Mars schreibt. Unser interaktiver Artikel über die besten Programmiersprachen versucht, das Problem der Schätzung der Popularität einer Sprache durch die Suche nach Proxy-Signalen zu lösen.
Dies erreichen wir, indem wir Beliebtheitsmetriken aus verschiedenen Datenquellen erstellen, die unserer Meinung nach gute Indikatoren für das aktive Interesse an jeder Programmiersprache sind. Insgesamt identifizieren wir 63 Programmiersprachen. Anschließend gewichten wir jede Datenquelle, um einen allgemeinen Beliebtheitsindex zu erstellen, wobei wir einige der Sprachen mit der niedrigsten Bewertung ausschließen. Im Folgenden beschreiben wir die Datenquellen, die wir zur Ermittlung der Maße verwenden, und das Gewichtungssystem, das wir zur Erstellung der Gesamtindizes verwenden.
Mit Beliebtheit meinen wir, dass wir versuchen, Sprachen zu bewerten, die aktiv verwendet werden. Wir betrachten drei verschiedene Aspekte der Beliebtheit: Sprachen, die bei typischen IEEE-Mitgliedern und arbeitenden Softwareentwicklern aktiv verwendet werden (das „Spectrum“-Ranking), Sprachen, die von Arbeitgebern nachgefragt werden (das „Jobs“-Ranking) und Sprachen, die am Puls der Zeit sind (das „Trends“-Ranking).
Wir haben die Sprachpopularität anhand der folgenden Quellen anhand von insgesamt acht Kennzahlen bewertet (siehe unten). Wir haben die Informationen für alle Metriken im Juli und August 2024 gesammelt. Die Daten wurden manuell erfasst, um zu verhindern, dass die Ergebnisse aufgrund von API-Änderungen oder -Beendigungen verzerrt werden und weil viele Namen von Programmiersprachen (C++, Scheme) im Widerspruch zu gängigen Begriffen in Forschungsartikeln stehen und Stellenausschreibungen oder waren für eine Suchmaschine schwer zu analysieren. Wenn eine große Anzahl von Suchergebnissen es unmöglich machte, Unklarheiten durch die individuelle Untersuchung aller Ergebnisse zu beseitigen, verwendeten wir eine Stichprobe aus jeder Datenquelle und ermittelten die relevante Stichprobengröße auf der Grundlage der Schätzung des tatsächlichen Durchschnitts mit einer Sicherheit von 95 %. Nicht alle Datenquellen enthalten Informationen für jede Programmiersprache und wir interpretieren diese Informationen so, dass die Programmiersprache „keine Ergebnisse“ liefert (d. h. sie ist nicht beliebt).
Die Ergebnisse jeder Messung werden normalisiert, um einen relativen Beliebtheitswert zwischen 0 und 1 zu erhalten. Anschließend werden die einzelnen Messungen mit einem Gewichtungsfaktor multipliziert, kombiniert und das Ergebnis erneut normalisiert, um einen aggregierten Beliebtheitswert zu erhalten.
Durch die Aggregation der Metriken hoffen wir, statistische Besonderheiten zu kompensieren, die den Beliebtheitswert einer Sprache in einer bestimmten Datenquelle verzerren könnten. Durch Variation der Gewichtungsfaktoren können wir unterschiedliche Ergebnisse für die Rankings „Spektrum“, „Jobs“ und „Trending“ erstellen. Wir sind uns voll und ganz bewusst, dass diese Gewichtungen zwar subjektiv sind, aber auf unserem Verständnis der Quellen und unserer bisherigen Berichterstattung über softwarebezogene Themen basieren. Durch unterschiedliche Gewichtungsfaktoren können wir unterschiedliche Arten der Beliebtheit hervorheben und unterschiedliche Rankings erstellen. Anschließend haben wir jede gewichtete Datenquelle für jedes Programm kombiniert und dann die resultierende Häufigkeit renormiert, um einen aggregierten Beliebtheitswert zu erstellen.
Die Top Programming Languages wurden ursprünglich vom Datenjournalisten Nick Diakopoulos erstellt. Unsere statistische Methodikberaterin ist Hilary Wething. Forschungsunterstützung wurde von Elizabeth Wood bereitgestellt. Rankings werden mit R berechnet.
Google ist die weltweit führende Suchmaschine und daher ein ideales Tool, um die Popularität einer Sprache einzuschätzen. Wir haben die Anzahl der Ergebnisse für jede Sprache gemessen, indem wir nach „Programmiersprache X“ (in Anführungszeichen) gesucht haben, und die Anzahl der von der Suche zurückgegebenen Ergebnisse manuell aufgezeichnet. Wir haben diese Messung im Juli 2024 durchgeführt. Diese Messung gefällt uns, weil sie den Umfang der Online-Informationsressourcen zu jeder Programmiersprache angibt.
Stapelüberlauf
Stack Overflow ist eine beliebte Website, auf der Programmierer Fragen zum Codieren stellen können. Wir haben die Anzahl der Fragen zu jedem Programm in der Woche vor unserer Forschung (August 2024) aufgezeichnet. Für die Mathematica/Wolfram-Sprache haben wir uns auf die Schwesterseite der Mathematica-Plattform „Stack“ verlassen und die Anzahl der in der letzten Woche gestellten programmierbezogenen Fragen gezählt. Diese Daten wurden manuell erfasst. Diese Metrik gibt an, welche Programmiersprachen derzeit im Trend liegen.
IEEE Xplore Digital Library
IEEE unterhält eine digitale Bibliothek mit Millionen von Konferenz- und Zeitschriftenartikeln aus einem breiten Spektrum wissenschaftlicher und technischer Disziplinen. Wir haben nach Artikeln gesucht, in denen jede der „X-Programmierung“-Modellsprachen für die Jahre 2023 und 2024 erwähnt wurde, da dies der kleinste Zeitraum war, für den wir auf Artikel zugreifen konnten. Für Suchergebnisse, die Tausende von Artikeln ergaben, haben wir die richtige Stichprobengröße für ein 95-prozentiges Konfidenzintervall (normalerweise knapp über 300) ermittelt und diese Anzahl von Artikeln extrahiert. Für jede von uns untersuchte Sprache haben wir den Anteil der Artikel ermittelt, die die Programmiersprache verwenden, und dann die Gesamtzahl der Artikel mit diesem Anteil multipliziert, um die wahrscheinliche Gesamtzahl der Artikel zu berechnen, die sich auf eine bestimmte Programmiersprache beziehen. Wir haben diese Untersuchung im Juli 2024 durchgeführt. Diese Metrik erfasst die Verbreitung verschiedener Programmiersprachen, wie sie in Ingenieurstudien verwendet und referenziert werden.
IEEE-Jobseite
Wir haben die Nachfrage nach verschiedenen Programmiersprachen in Stellenausschreibungen auf der IEEE-Jobseite gemessen. Für Suchergebnisse, die Tausende von Stellenausschreibungen ergaben, haben wir die richtige Stichprobengröße für ein 95-prozentiges Konfidenzintervall ermittelt (normalerweise etwa 300 Ergebnisse) und diese Anzahl von Stellenausschreibungen extrahiert, um sie manuell zu überprüfen. Für jede von uns untersuchte Sprache haben wir den Anteil der Stellenausschreibungen ermittelt, die die Programmiersprache verwendeten, und dann die Gesamtzahl der Stellenausschreibungen mit diesem Anteil multipliziert, um die wahrscheinliche Gesamtzahl der Stellenausschreibungen zu berechnen, die sich auf eine bestimmte Programmiersprache beziehen. Da einige der von uns erfassten Sprachen im Klartext mehrdeutig sein können (z. B. lD, Go, J, Ada und R), haben wir außerdem nach Stellenausschreibungen gesucht, die diese Wörter in der Stellenbeschreibung enthielten, und die Ergebnisse dann manuell überprüft , Neuabtastung der Eingaben, wenn die Anzahl der Ergebnisse groß war. Die Suche wurde im Juli 2024 durchgeführt. Die IEEE-Jobseite gefällt uns aufgrund ihrer großen Anzahl an Stellenausschreibungen außerhalb der USA, was sie zu einem idealen Instrument zur Messung der weltweiten Beliebtheit macht.
Karrierebauer
Wir haben die Nachfrage nach verschiedenen Programmiersprachen auf der CareerBuilder-Jobseite gemessen. Wir haben nach Stellenangeboten im Bereich „Entwickler“ gesucht, die in den Vereinigten Staaten angeboten werden, da dies die beliebteste Berufsbezeichnung für Programmierer ist. Wir haben 400 Stellenausschreibungen beprobt und manuell überprüft, um die in den Stellenausschreibungen erwähnten Arbeitgeber in den Sprachen zu identifizieren. Die Suche wurde im Juli 2024 durchgeführt. Wir möchten, dass die Karriere-Bauseite die Beliebtheit von Programmiererjobs in den Vereinigten Staaten ermittelt.
GitHub
GitHub ist ein öffentliches Repository für viele von Freiwilligen betriebene Open-Source-Softwareprojekte. Wir haben von GitHut 2.0 gesammelte Daten verwendet, das die 50 am häufigsten verwendeten Sprachen basierend auf der Anzahl der mit dieser Sprache getaggten Repositorys misst und auf der öffentlichen API von GitHub aufbaut. Wir verwenden zwei Metriken von GitHub: Repositories, die von Benutzern „markiert“ wurden, um langfristige Interessen widerzuspiegeln, und die Anzahl der Pull-Anfragen, um die aktuelle Aktivität anzuzeigen. Die Daten decken das zweite Quartal 2024 ab. Diese Kennzahlen geben an, in welchen Sprachen Programmierer arbeiten möchten, wenn sie eine persönliche Entscheidung haben.
Bibliothek des Trinity College Dublin
Die Trinity College Dublin Library ist eine von sechs Pflichtexemplarbibliotheken in Irland und im Vereinigten Königreich. Eine Kopie jedes in Irland veröffentlichten oder vertriebenen Buches muss bei der Bibliothek hinterlegt werden, und auf Anfrage muss auch jeder britische Verleger oder Vertreiber ein Buch hinterlegen. Wir haben nach allen Büchern gesucht, die im bisherigen Jahresverlauf erschienen sind und deren Thema der Kategorie Computerprogrammierung zugeordnet wurde, und die Anzahl der Rücksendungen summiert. Die Suche wurde im Juni 2024 durchgeführt. Diese Bibliothekssammlung gefällt uns, weil sie eine große, kategorisierte Auswahl an Werken, hauptsächlich in englischer Sprache, darstellt.
Zwietracht
Discord ist eine beliebte Chat-Plattform, auf der sich viele Programmierer austauschen. Wir haben die Anzahl der Tags gezählt, die jeder Sprache entsprechen. Im Fall von Sprachen, bei denen es sich auch um Namen von Nicht-Programmierthemen handeln könnte (viele Nicht-Programmierthemen haben auch dedizierte Discord-Server; „Julia“ könnte sich beispielsweise auf die Programmiersprache oder die Sesamstraßenpuppe beziehen), sind die Ergebnisse wurden manuell überprüft. Auf Disboard wurde im August 2024 zugegriffen. Disboard listet viele öffentliche Discord-Server auf und viele junge Programmierer nutzen die Website, was zu einer anderen Zielgruppe von Programmierern beiträgt.