您的位置:首页 > 科技 >

Facebook为代码搜索AI基准测试开源数据集

2019-10-10 16:49:23 来源:新媒体传播网

Facebook AI研究人员利用GitHub和Stack Overflow的信息创建了代码搜索数据集。该版本包含287个Stack Overflow问答对的评估数据集,其中包括代码段,以及来自GitHub上近25,000个Android存储库的代码段搜索语料库。

《 神经密码搜索评估数据集》于8月在arXiv上发布,并于周三进行了修订。堆栈溢出数据来自堆栈溢出数据转储,而GitHub Rest API提供了其余数据。

Facebook AI在博客文章中说:“我们打算将此数据集用作评估各种代码搜索模型中搜索质量的基准。”

本文还分享了Facebook创建的两个AI模型的结果,作为对语料库和数据集的测试。

代码搜索旨在为开发人员提供一种使用自然语言来显示大量编程语言代码的方法。许多代码搜索计划正在进行中,例如GitHub的语义代码项目和机器学习计划以及像Y Combinator毕业生Metacode这样的新兴公司。

在针对软件开发人员的AI的其他发展中,今年春季Google Brain引入了AI,该AI可以基于先前的编辑来预测代码。

栏目导读

IDEMIA Identity&Security USA授权ORNL先进的光学阵列

IDEMIA Identity&Security USA已授权在能源部橡树岭国家实验室开发的先进光学阵列。便携式技术可用于帮助识别具有挑战性的...

2019-08-10 18:16

自动驾驶汽车开发商可以选择传感器融合解决方案和L2 +功能

2018是每年在技术进步的自主驾驶(AD)的市场重点放在共享平台的移动性,整合电气 电子(E E)架构人工智能在AD的各个方面...

2019-08-14 10:24

ITC Infotech将创建一个智能数字劳动力

ITC Infotech是全球领先的技术解决方案和服务提供商,也是ITC Ltd 的全资子公司,正在推出一种独特的数字化劳动力解决方案...

2019-08-14 13:51

中国人工智能的独角兽企业Squirrel AI Learning深入参与的研究项目

深度学习的第一个国际研讨会:方法和应用(DLG 2019)在苏州举行,阿拉斯加,美国于2019年8月5。值得一提的是,在中国人工智能...

2019-08-14 15:17

新的类似Spectre的CPU漏洞绕过了现有的防御

安全研究人员发现了一种新的方法来滥用现代CPU的推测执行机制来打破安全边界并泄漏内核内存的内容。这项新技术滥用了一个名为...

2019-08-14 15:48
焦点
头条关注
热点新闻