IBM Research
12.05.2021, 08:24 Uhr
Entwickeln mit KI
IBM hat auf der Think-Konferenz des Unternehmens angekündigt, den Code von 14 Millionen Beispielen mit 500 Millionen Codezeilen in 55 Programmiersprachen zu veröffentlichen. Der Datensatz soll helfen KI-Anwendungen für Entwickler zu trainieren.
Neue KI-Lösungen verändern die Art und Weise, wie Unternehmen IT entwickeln, bereitstellen und betreiben sowie Anwendungen modernisieren. Der Datensatz von Project CodeNet verbessert die Fähigkeit von KI, Code zu verstehen und zu übersetzen: IBM Research veröffentlicht Project CodeNet, einen großen Open-Source-Datensatz mit 14 Millionen Code-Beispielen, 500 Millionen Codezeilen und 55 Programmiersprachen. Dieser Schritt soll das Verständnis und die Übersetzung von Code durch KI zu ermöglichen.
Project CodeNet ist laut IBM derzeit der größte und differenzierteste Datensatz seiner Art und adressiert drei Hauptanwendungsfälle in der heutigen Programmierung: Codesuche (automatische Übersetzung eines Codes in einen anderen, einschließlich älterer Sprachen wie COBOL), Codeähnlichkeit (Identifizierung von Überschneidungen und Ähnlichkeiten zwischen verschiedenen Codes), und Codeeinschränkungen (Anpassung von Einschränkungen basierend auf den spezifischen Anforderungen und Parametern eines Entwicklers).
IBM ist überzeugt, dass Project CodeNet als wertvoller Benchmark-Datensatz für die Übersetzung von Quellcode und die Umstellung von Legacy-Codebasen auf moderne Codesprachen dienen kann. Er soll Unternehmen auch dabei helfen, ihre KI-Nutzung zu beschleunigen. Weitere Informationen lesen Sie im Blogartikel Kickstarting AI for Code: Introducing Project CodeNet unter https://research.ibm.com/blog/codenet-ai-for-code.