GitHub 和 OpenAI 推出新的 AI 工具，可生成自己的代码

619 [ 互联网 ]

GitHub 和 OpenAI 发布了一个名为 Copilot的新 AI 工具的技术预览版,该工具位于 Visual Studio Code 编辑器中并自动完成代码片段。

根据 GitHub 的说法,Copilot 所做的不仅仅是模仿以前见过的代码。相反,它会分析您已经编写的代码并生成新的匹配代码,包括之前调用的特定函数。该项目网站上的示例包括自动编写代码以导入推文、绘制散点图或获取 Goodreads 评级。

根据GitHub 首席执行官 Nat Friedman的博客文章,它最适合 Python、JavaScript、TypeScript、Ruby 和 Go 。

GitHub 将其视为结对编程的演变,其中两个编码员将在同一个项目上工作,以发现彼此的错误并加快开发过程。使用 Copilot,其中一位编码员是虚拟的。

该项目是微软向 OpenAI投资 10 亿美元的第一个主要成果,该研究公司现在由 Y Combinator 总裁 Sam Altman 领导。自从 Altman 接任以来,OpenAI 已经从非营利状态转向了“利润上限”模式,接受了微软的投资,并开始授权其 GPT-3 文本生成算法。

Copilot 建立在一种名为 OpenAI Codex 的新算法之上,OpenAI 首席技术官 Greg Brockman将其描述为 GPT-3 的后代。

GPT-3 是 OpenAI 的旗舰语言生成算法,它可以生成有时与人类书写无法区分的文本。它之所以能够写出如此令人信服的文字,是因为其庞大的 1750 亿个参数,或者允许算法连接字母、单词、短语和句子之间关系的可调旋钮。

GPT-3 生成英语,而 OpenAI Codex 生成代码。OpenAI 的一位代表在一封电子邮件中告诉The Verge,OpenAI 计划在今年夏天晚些时候通过其 API 发布 Codex 版本,以便开发人员可以使用该技术构建自己的应用程序。

Codex 接受了从 GitHub 中提取的 TB 级公开代码以及英语语言示例的训练。

虽然网站上的评价对 Copilot 提供的生产力提升赞不绝口,但 GitHub 暗示并非所有使用的代码都经过了错误、不安全实践或个人数据的审查。该公司写道,他们已经设置了一些过滤器来防止 Copilot 生成令人反感的语言,但它可能并不完美。

“由于底层技术的预发布性质,GitHub Copilot 有时可能会产生不需要的输出,包括有偏见、歧视、滥用或攻击性的输出,”Copilot 的网站说。

鉴于对 GPT-3 的偏见和滥用语言模式的批评,OpenAI 似乎还没有找到一种方法来防止算法继承其训练数据中最糟糕的元素。

该公司还警告说,该模型可能会建议电子邮件地址、API 密钥或电话号码,但这种情况很少见,并且已发现数据是由算法合成或伪随机生成的。但是,Copilot 生成的代码大部分是原创的。GitHub 进行的一项测试发现,只有 0.1% 的生成代码可以在训练集中逐字找到。

这不是第一个尝试自动生成代码以帮助辛勤程序员的项目。初创公司Kite 推出了非常相似的功能,可用于超过 16 种代码编辑器。

目前,Copilot 处于受限的技术预览阶段,但您可以在该项目的网站上注册以获得访问它的机会。