Es gibt neue Einblicke, wie gut LLMs programmieren können – denn bislang war es schwer zu messen, wie zuverlässig Sprachmodelle arbeiten. Häufig liefern sie gute Ergebnisse, manchmal keine und selten ...