GitHub副驾驶员自称为软件开发人员的“人工智能配对程序员”,自动实时建议代码。根据GitHub的说法,Copilot是“由食典委的生成式预训练AI模型OpenAI,并接受了“来自公开来源的自然语言文本和源代码,包括GitHub上公共存储库中的代码”的培训。

然而,一个集体诉讼起诉其母公司GitHub Copilot微软,和OpenAI声称开源软件盗版和违反开源许可证.具体来说,该诉讼指出,Copilot生成的代码不包括代码原作者的任何归属、版权声明或许可证副本,而大多数开源许可证都需要这些。

“开源精神不仅仅是一个人们想要保持开放的空间,”他说萨尔Kimmich是一名开源开发者的倡导者Sonatype他是机器学习工程师,开源贡献者和维护者。“我们已经开发了流程,以保持开源的安全,这需要可追溯性、可观察性和可验证性。副驾驶隐瞒了这些代码片段的原始来源。”

“我非常希望这次诉讼的结果能成为我未来在训练模型时做出决定的依据。”
-Stella Biderman, EleutherAI

为了解决开源许可的问题,GitHub计划引入一个新的Copilot功能,该功能将“提供一个开源的功能”类似于公共代码的建议参考在GitHub上,以便您可以就是否以及如何使用该代码做出更明智的决定”,包括“在适当的情况下提供归属”。GitHub也有一个可配置的过滤器以阻止匹配公共代码的建议

然而,正如GitHub所述,责任仍然落在了开发人员身上副驾驶的条款和条件“GitHub不主张建议中的任何权利,您保留对您的代码(包括您在代码中包含的建议)的所有权和责任。”

除了开源许可问题外,Copilot还担心使用公开代码训练系统的合法性,以及生成的代码是否会导致版权侵权。

基米奇指着谷歌v。甲骨文例,其中“接受方法的名称,但不接受函数实现,是可以的。”你替换了功能内容,但仍然保留了一些模板。”以Copilot为例,它可能逐字生成受版权保护的代码。(参见下面的相关推文蒂姆•戴维斯德克萨斯农工大学(Texas A&M University)计算机科学教授,作为Copilot生成受版权保护代码的例子。)

装备沃尔什他是律师事务所的高级律师电子前沿基金会他认为,培训副驾驶使用公共存储库是合理使用的。“合理使用保护分析性地使用受版权保护的作品。Copilot正在消化代码,并在自己的神经网络中创建关联,了解哪些代码会遵循哪些内容,在哪些环境中出现,而对底层作品的事实分析正是涉及视频游戏机、搜索引擎和api的案例所支持的合理使用。”

但当谈到生成代码时,沃尔什说,这可以归结为“(Copilot)从任何给定的训练数据元素中复制了多少”,以及它是否包含可版权的创造性表达。“如果是这样,就可能发生侵权,”她说。

针对GitHub Copilot的诉讼是第一起挑战生成式人工智能的诉讼。沃尔什说:“这为其他生成工具树立了法律先例。”“这种类型的作品,如果一个人创作了它,就有资格获得版权保护,而且它可以体现其他人受版权保护的作品,就像代码片段一样。”

“作为一名工程师,如果我想使用副驾驶,我需要能够将它提供给我的代码限制在归属于许可证的代码上。”
-Sal Kimmich, Sonatype

斯特拉·彼得曼他是斯坦福大学的人工智能研究员博思艾伦咨询公司而且EleutherAI在美国,这起诉讼是一个可喜的进展。她说:“我希望,这将为什么是真正合法的提供明确和指导,这是那些致力于开源人工智能的人面临的大问题之一。”“我非常希望这次诉讼的结果能成为我未来在训练模型时做出决定的依据。”

开源社区似乎对这起诉讼和GitHub Copilot本身存在分歧。例如,软件自由保护协会(Software Freedom Conservancy)一直直言不讳地表达了对Copilot的担忧-甚至呼吁抵制github -但这是事实对加入集体诉讼持谨慎态度.Kimmich说,他们知道有些开源开发者出于道德的立场选择不使用Copilot,但也有一些人喜欢它:“他们在开发和执行代码的过程中学习。”

Kimmich是Copilot的候补名单之一,并认识到它为开发人员提供的好处。“它背后的神经网络不仅仅使用代码来帮助你——它还提供了更多的上下文信息,”他们说。“这意味着我作为一名开发者现在拥有了一种扩展智能,这为我提供了一种情境化的建议。我认为这很好。这是迄今为止我们在这个应用程序中拥有的最强大的生成智能。”

然而,除非开源许可问题得到解决,否则基米奇预计GitHub Copilot只会用于宠物项目和探索新的软件包。他们说:“由于许可问题,它没有提供生产代码。”“如果我作为一名工程师想要使用Copilot,我需要能够限制它提供给我的代码归属于许可证,或者拥有一个表明它是共同开发的许可证。如果我无法找到原始许可或原始知识产权的来源,那么我就需要知道我是否想要避免它。”

另一个解决方案是,GitHub Copilot修改其人工智能模型,以便追踪归因,并将功劳归于代码的原作者,并在此过程中添加相关的版权声明和许可条款,Biderman表示,这在技术上是可行的。“OpenAI和微软似乎采取的立场是,当其他模式成功地进行过滤时,通过许可进行过滤对他们来说过于繁重。”她指出了一些学术模型,比如驿码举个例子用它许可的代码训练.“还有其他的选择和模式,它们更合乎道德,也更可能合法,”比德曼说。
对话(1)
FB TS 2022年11月21日
INDV

开源软件(OSS)适合个人家庭使用,但政府/军队/公司/组织应该/必须绝对远离它!

因为世界上任何人都可以修改它&对于一个专业程序员来说,创建/插入新的错误到常用的OSS中并不是很难,同时假装为已知的错误提供了很好的修复!

更不用说,软件开发是最复杂/艰难的工作之一,有经验的程序员免费提供他们的时间/劳动力将是一个非常糟糕的例子,导致所有专业程序员的工资/福利降低!

为什么函数式编程应该是软件开发的未来

这很难学习,但是您的代码将产生更少令人讨厌的意外

11分钟读取
垂直
一盘用代码做成的意大利面
Shira Inbar
DarkBlue1

你期望人生中最长、最昂贵的阶段一个软件产品的周期是系统的初始开发,当所有这些伟大的功能都是第一次想象,然后创建。事实上,最难的部分出现在后面的维护阶段。这时程序员就会为他们在开发过程中走的捷径付出代价。

那么,他们为什么要走捷径呢?也许他们没有意识到自己在偷工减料。只有当他们的代码被大量用户部署和使用时,隐藏的缺陷才会暴露出来。也许开发人员太匆忙了。推向市场的时间压力几乎保证了他们的软件会包含更多的bug。

继续阅读↓ 显示更少
{“imageShortcodeIds”(“31996907”):}
Baidu